Informatique et Santé Collection dirigée par P. Degoulet et M. Fieschi Paris, Springer-Verlag France Information Médicale : Aspects Déontologiques, Juridiques et de Santé Publique Rédacteurs : L. Dusserre, M. Goldberg et R. Salamon Tendances en traitement du langage naturel Robert Baud, Christian Lovis, Anne-Marie Rassinoux, Jean-Raoul Scherrer Division d'Informatique Médicale Hôpital Cantonal Universitaire de Genève, 1211 Genève 14, Suisse< email: Robert.Baud@dim.hcuge.ch Abstract This article considers recent developments in Natural Language Processing of medical texts and is an attempt to figure out the emerging trends in the years to come. New Natural Language Processing (NLP) tools for professionals are soon to be delivered. Once they are on the market, the medical documentation methods may undergo a complete revolution. The question is to know when such a change may occur and what are the expected functionalities. Informatique et Santé : Springer-Verlag France, Paris, 1996 (8) : 111-119 1. Introduction Le traitement de la langue naturelle par ordinateur va entrer dans une phase décisive ces prochaines années, devant aboutir à l'usage productif de ces techniques nouvelles. Dépendant des succès d'implémentation et de la vitesse de maturation de ces produits, on peut s'attendre à une certaine révolution des méthodes de travail concernant la tenue et la gestion des dossiers médicaux. En effet, là où aujourd'hui on émerge à peine du dossier manuel, de la machine à écrire et du traitement de texte sur micro-ordinateur, il ne fait nul doute que demain s'y installera des méthodes beaucoup plus professionnelles pour la saisie, l'aide à la rédaction, la navigation et le stockage des documents médicaux, principalement les textes. La question est bien de savoir à quel terme ce changement se produira et quelles en sont ses promesses fonctionnelles. L'avènement du traitement de la langue naturelle dans le domaine médical est une promesse depuis belle lurette, mais les résultats parfois déçoivent ou tout au moins se font par trop attendre. Par ailleurs, il est bien certain que nul ne pourra ignorer ces techniques quand elles seront réellement disponibles, tant il est vrai que la langue naturelle est prépondérante dans la documentation des cas médicaux. Il est d'ores et déjà acquis que les outils à venir seront tous disponibles sur une plate-forme de bas coût ou sinon qu'ils n'auront pas d'avenir. Ces conditions font que tout un chacun est dans l'expectative des plus récents développements dans ce domaine et souhaite anticiper la transition vers de nouveaux outils dans le cadre de l'institution où il travaille. Démarrer trop tôt signifie supporter les défauts de jeunesse des techniques de traitement de la langue naturelle ; trop tarder fait courir le risque d'une pression soudaine des utilisateurs sans avoir préparé le terrain et de se trouver limité par des budgets n'ayant pas anticipé ce type de développement. Cet exposé veut faire le point sur différentes tendances qui apparaissent et mettent en évidence des résultats récents. Il s'agira de bien faire le point entre ce qui existe aujourd'hui comme prototype de démonstration, ce qui peut rapidement devenir un produit disponible sur le marché, et ce qui doit encore se consolider au fil du temps, et par conséquent ne saurait être commercialisé à court terme. Cette vérité sur le thème être ou ne pas être est due à toute personne qui se pose des questions sur le traitement de la langue naturelle en médecine. Afin de donner le ton, on peut citer une affirmation de l'auteur à la conférence du groupe de travail WG6 [1] de la Fédération Internationale d'Informatique Médicale IMIA tenue en juin 1994, comme quoi « des résultats