Ontologie et traitement automatique de la langue naturelle Ontologie et TALN : l’anonymisation au service du repérage conceptuel dans le contexte de la SLA Sonia Cardoso 1 , Luis Felipe Melo Mora 2 , Marie-Christine Jaulent 2 , Xavier Aimé, David Grabli 3 , Vincent Meininger 5 , Jean Charlet 2,4 1 IHU-A-ICM Institut des Neurosciences Translationnelles de Paris, s.cardoso-ihu@icm-institute.org 2 INSERM UMRS 1142, LIMICS, F-75006, Paris Sorbonne Universités, UPMC Univ. Paris 06, UMR_S 1142, LIMICS, F-75006, Paris Université Paris 13, Sorbonne Paris Cité, LIMICS, (UMR_S 1142), F-93430, Villetaneuse luisfe.melo@gmail.com 3 Assistance Publique Hôpital Pitié Salpêtrière, Département des maladies du Système Nerveux, Paris Université Pierre et Marie Curie david.grabli@psl.aphp.fr 4 Assistance Publique –Hôpitaux de Paris DRCD, F-75004 PARIS jean.charlet@upmc.fr 5 Ramsay General de Santé, Hôpital Peupliers Paris vincent.meininger@psl.aphp.fr Résumé : L’objectif de notre travail est l’exploitation de la base évènementielle du réseau SLA (Sclérose Latérale Amyotrophique) d’Île-de-France (IDF), pour permettre à long terme, de comprendre les ruptures de parcours de santé. Pour analyser ce corpus une chaine de pré traitement est nécessaire. L’un de ces processus est l’anonymisation, processus consistant à masquer l’ensemble des éléments ne permettant pas l’identification d’une personne. Ce processus de changement de données nominales en catégories sémantiques, permet secondairement une amélioration du repérage des concepts de l’ontologie du domaine, lors de l’utilisation d’outils du traitement automatique de la langue naturelle (TALN). Mots-clés : Ontologie, anonymisation, parcours de soins, sclérose latérale amyotrophique. 1 Introduction L’Ingénierie des Connaissances permet la construction d’ ontologies notamment dans le domaine médical qui, associées aux outils de Traitement Automatique de la Langue Naturelle (TALN), permettent d’exploiter des corpus à des fins de compréhension de processus et d’analyse. L’objectif de notre travail, à long terme, est d’analyser et identifier les indicateurs de ruptures dans le parcours de santé 1 de personnes ayant une pathologie neurodégénérative, en particulier la Sclérose Latérale Amyotrophique (SLA) en exploitant la base de données « évènementielle » 1 L’Article 14 de la Loi de modernisation de notre système de santé définit dans l’article L. 6327-1 du Code de la santé publique, le parcours de santé complexe, lorsque l’état de santé, le handicap ou la situation sociale du patient rend nécessaire l’intervention de plusieurs catégories de professionnels de santé, sociaux ou médico-sociaux