Une approche pour la Représentation Sémantique de Documents Mustapha BAZIZ, Mohand BOUGHANEM, Nathalie AUSSENAC-GILLES baziz@irit.fr , boughane@irit.fr, aussenac@irit.fr IRIT Campus Univ. Toulouse III 118 Route de Narbonne F-31062 Toulouse Cedex 4, France Mots clefs: Recherche d’Information, Représentation Sémantique de Documents, Ontologies, WordNet Keywords: Information Retrieval, Semantic Representation of Documents, Ontologies, WordNet. Palabras clave: el buscar de la información, representación semántica de documentos, Ontologies, WordNet. Résumé Cet article traite de l’application des ontologies au domaine de la recherche d’information. L’objectif de l’approche est de représenter le contenu sémantique de documents. L’approche consiste à projeter les documents sur une ontologie linguistique générale, telle que WordNet. Il s’agit d’identifier pour chaque document les représentants de concepts de l’ontologie. Ces derniers peuvent être des mots simples ou des groupes de mots. Un critère de cooccurrence (CF.IDF) est utilisé pour extraire les concepts importants. Un deuxième critère qui est la similarité sémantique entre concepts, permet de les désambiguïser via le réseau sémantique de l’ontologie. Le résultat de ce "matching" entre le document et l’ontologie est un ensemble de concepts désambiguïsés (appelés aussi concepts-sens ou noeuds) avec des liens pondérés entre eux, formant ce que nous appelons le noyau sémantique de document qui représente au mieux le contenu sémantique du document. L’approche proposée peut être considérée comme une première étape vers l’objectif à long terme qui est l’indexation intelligente et la recherche sémantique.