Marqueurs de la relation cause-effet : stabilité et variation dans des corpus de nature différente Elizabeth Marshman 1 , Marie-Claude L’Homme 2 et Victoria Surtees 2 1 Observatoire de linguistique Sens-Texte / Université d’Ottawa, elizabeth.marshman@uottawa.ca 2 Observatoire de linguistique Sens-Texte, Université de Montréal, mc.lhomme@umontreal.ca , vsurtees@gmail.com Résumé : Les marqueurs lexicaux figurent parmi les indicateurs les plus intéressants pour identifier et classer finement des relations terminologiques. Cependant, l’exploitation des marqueurs pour repérer automatiquement ou semi-automatiquement les relations dans des corpus, notamment des corpus associés à des domaines ou à des genres textuels différents, peut soulever des problèmes. Le présent article fait le bilan d’une analyse de 37 marqueurs verbaux de la relation cause-effet dans trois corpus représentant trois domaines (médecine, informatique et psychologie) et deux genres textuels (textes didactiques/vulgarisés et textes spécialisés). Il décrit les variations observées dans l’identification de sens spécifiques indiquant différents sous-types de la relation, et commente la difficulté de prévoir les marqueurs les plus efficaces pour extraire ces relations de différents corpus. Mots-clés : Relations terminologiques, Marqueurs de relations, Cause-effet, Domaine, Genre textuel. 1 Introduction Les marqueurs lexicaux sont des unités lexicales ou des combinaisons d’unités lexicales qui expriment de façon récurrente une relation terminologique ; elles apparaissent le plus souvent comme la composante centrale d’un patron de connaissances (knowledge pattern dans la terminologie de Meyer (2001)) et relient deux unités partageant un lien sémantique. Par exemple, le patron de connaissances X stimule Y, comme dans l’hormone stimule la croissance, indique la présence d’une relation causale. L’association récurrente d’unités lexicales et l’expression formelle d’une relation terminologique (réalisée par le marqueur) permet de repérer des relations terminologiques (semi-)automatiquement dans des textes. Bien qu’il ne s’agisse pas des seuls indicateurs de relations terminologiques, les marqueurs lexicaux sont particulièrement intéressants à exploiter dans la mesure où ils permettent d’identifier clairement et de classer finement les relations terminologiques. Cependant, la récurrence de ces marqueurs ne veut pas dire qu’ils constituent des indices d’une portée universelle ; leur utilisation dans des corpus de nature différente (c’est-à-dire dans des domaines ou genres textuels distincts) soulève des difficultés.