TALN 2002, Nancy, 24-27juin 2002 Découpage thématique des conversations: un outil d'aide à l'extraction Narjès Boufaden, Guy Lapalme et Yoshua Bengio {boufaden, lapalme, bengioy}@iro.umontreal.ca Département d'Informatique et Recherche Opérationnelle Université de Montréal, Quebec Canada Résumé Dans cet article, nous décrivons la complexité du traitement automatique des conversations. En particulier, nous étudions la problématique de l'extraction d'information à partir des conversations et nous présentons le découpage thématique comme un outil d'aide à l'extraction. Mots clés : Découpage thématique, analyse de conversations, extraction d'information Keywords: Topic segmentation, conversation analysis, information extraction Introduction Le découpage thématique consiste à diviser un texte en passages cohérents. Chaque passage est un ensemble de phrases ou d'énoncés qui partagent le même thème. Le découpage thématique est très utile pour certaines applications du Traitement Automatique de la Langue (TAL), telles que la recherche d'information, le résumé automatique ou la résolution d'anaphores. Dans cet article, nous montrons qu'il est aussi utile pour l'extraction d'information à partir de conversations. Notre travail s'inscrit dans le cadre d'un projet mené par le département de la défense canadienne et a pour but l'exploitation des comptes rendus téléphoniques de missions de recherche et sauvetage maritime. Nous avons défini une approche d'extraction composée de trois étapes. La première, le découpage thématique sépare la conversation en segments cohérents possédant des propriétés qui facilitent le processus d'extraction. La deuxième étape, 119