Condensés automatiques de textes Juan-Manuel Torres-Moreno École Polytechnique / Département de génie informatique Équipe de recherche en micro-électronique et traitement informatique des signaux (ERMETIS), Université du Québec à Chicoutimi Laboratoire d’ANalyse Cognitive de l’Information (LANCI), Université du Québec à Chicoutimi juan-manuel.torres@polymtl.ca Patricia Velázquez-Morales Laboratoire d’ANalyse Cognitive de l’Information (LANCI), Université du Québec à Chicoutimi Jean-Guy Meunier Laboratoire d’ANalyse Cognitive de l’Information (LANCI), Université du Québec à Chicoutimi meunier.jean-guy@uqam ______________________________________________________________________ ABSTRACT. Summarizing is a critical phase in the automatic analysis of texts. Abstract generation is a complex cognitive process. The state of art only allows the production of document condensations. This paper describes our method, Cortex, which uses an algorithmic-numerical approach to obtain a text abstract. The final condensation is independent of the subject and the size of the corpus. Cortex offers the added capability of producing condensations in French or Spanish in a short period of time. KEYWORDS : Text condensation, automatic summarizing, text analysis, statistical methods. RÉSUMÉ. L'obtention de résumés de textes constitue une phase critique dans l'analyse automatique de textes. La génération de résumes étant un processus cognitif difficile, l’état de l’art ne permet d’obtenir que des condensés des documents. Cet article décrit notre méthode Cortex, basé sur une approche numérique algorithmique, pour l'obtention d'un condensé d'un texte. Le condensé ainsi obtenu est indépendant du thème et de l'ampleur du corpus. Le système trouve en plus, des condensés de textes en français ou espagnol très rapidement. MOTS-CLÉ : Condensés de textes, résumés automatiques, analyse de textes, méthodes statistiques. ________________________________________________________________________ 1. Introduction L’obtention des résumes s’avère très important, car le volume d’informations généré est de plus en plus important. L’élaboration des méthodes d'obtention de résumés automatiques de textes constitue une phase cruciale dans l'analyse automatique de textes. Le condensé est le premier pas vers l’obtention d’un vrai résumé, qui est la forme concrète la plus connue et la plus visible de la condensation de textes. L’utilisation des méthodes linguistiques est certes pertinente, mais leur utilisation concrète demeure