TAL. Volume 44 – n° 2/2003, pages 39 à 68 Étiquetage sémantique des lexies dans la base de données DiCo Alain Polguère OLST — Département de linguistique et de traduction Université de Montréal C.P. 6128, succ. Centre-ville Montréal (Québec) H3C 3J7 Canada alain.polguere@umontreal.ca RÉSUMÉ. Le DiCo est une base de données lexicales du français, en développement depuis plusieurs années à l’Observatoire de linguistique Sens-Texte. La finalité première de cette base est de décrire chaque lexie selon deux axes : les dérivations sémantiques (relations sémantiques fortes) qu’elle entretient avec d’autres lexies de la langue et les collocations (expressions semi- idiomatiques) qu’elle contrôle. Cette description s’accompagne d’une modélisation des structures syntaxiques régies par la lexie et d’une modélisation de son sens, sous forme d’étiquetage sémantique. Cet article introduit le système des étiquettes sémantiques du DiCo, du point de vue de ses fondements théoriques et de la méthodologie de construction d’une hiérarchie d’étiquettes. Il explique aussi le rôle central que peut jouer ce type d’étiquetage dans un contexte de lexicographie informatisée. ABSTRACT. The DiCo is a French lexical database, under construction for several years at the Observatory of Meaning-Text linguistics. Its main target is the description of lexical units along two axes: semantic derivations (strong semantic relations) linking the lexie to others, and collocations (semi-idiomatic expressions) controlled by the lexie. The description also embodies the modeling of syntactic structures governed by the lexie and the modeling of its meaning, by means of a semantic labeling. This paper focuses on presenting in detail the DiCo system of semantic labels: theoretical foundations and methodology for building a hierarchy of labels. It also explains the central role that a well-designed system of semantic labels can play in computational lexicography. MOTS-CLÉS : base de données lexicales, hiérarchie lexicale, étiquette sémantique, collocation, dérivation sémantique, lexicologie explicative et combinatoire, théorie Sens-Texte, lexique du français. KEYWORDS. lexical database, lexical hierarchy, semantic label, collocation, semantic derivation, explanatory combinatorial lexicology, Meaning-Text theory, French lexicon.