Garric N. & Léglise I., 2005, « La place du logiciel, du corpus, de l'analyste : l'exemple d'une analyse de discours patronal à deux voix », in G. Williams, coord, Linguistique de corpus, Presses Universitaires de Rennes, 101-113. 1 Nathalie Garric et Isabelle Léglise Université de Tours 1 La place du corpus, de l’analyste, du logiciel : Exemple d’une analyse de discours patronal à deux voix Introduction : des questions méthodologiques L’analyse de discours est une linguistique de corpus au sens où l’on travaille sur des ensembles d’énoncés réellement proférés par des locuteurs authentiques, au sens où l’analyse est au moins en partie orientée, guidée, par le corpus (Tognelli-Bonelli, 2001). Elle peut de plus se pratiquer sur de très vastes corpus et nécessiter un traitement informatisé. Mais à la différence d’une linguistique de corpus qui s’intéresserait à ces ensembles comme à des textes, l’analyse de discours les situe socialement. Travailler sur des discours, c’est en effet supposer que les productions langagières étudiées sont influencées par leurs conditions de production (Pécheux, 1969, Courtine, 1981) i . Ces productions langagières émanent d’acteurs déterminés, assumant des rôles particuliers, engagés dans une situation de communication particulière ayant des caractéristiques certes singulières, mais aussi des caractéristiques plus générales, propres à un genre qu’il s’agit de définir. L’objectif est de mettre au jour des pratiques langagières particulières caractérisées par des régularités linguistiques, à travers notamment des répétitions de formes et de structures. A une pluralité ii d’approches et de positionnements théoriques en analyse de discours s’ajoute une grande variété de méthodes de traitement : analyses quantitatives et / ou qualitatives, activité de repérage et / ou d’interprétation manuelle, automatisée ou assistée par ordinateur etc. Nous nous intéresserons ici à un certain nombre de questions méthodologiques, en particulier au statut des données et à la place laissée au corpus dans l’analyse, au rôle du linguiste (notamment à la place laissée à son intuition) et à celui du logiciel (à la prise en compte des données quantitatives qui en sont issues) dans le cadre d’analyses sur gros corpus assistées par ordinateur. Pour M. Tournier par exemple (1996 : 182-183), la statistique lexicale est un outil susceptible de répondre à « une nécessité d’objectivité dans le traitement des données ». Il avance que si cette nécessité se trouve satisfaite, alors tout chercheur se consacrant au même corpus doit aboutir aux mêmes constats. Si le traitement informatique permet en effet d’espérer obtenir des comptages semblables iii pour toute analyse réitérée, il nous semble qu’il ne peut pas — et ne doit en aucun cas — neutraliser l’étape d’interprétation des données sans laquelle le traitement ne reste que descriptif. Ce traitement laisse donc présager, en dépit de données quantitatives « objectives », des fluctuations, voire des divergences analytiques. Une analyse de discours réalisée conjointement à partir de communications orales ou écrites de 15 grands patrons français (Garric, Léglise, 2003) nous servira d’exemple. Le corpus, qui a été informatisé, comprend plus de 220 000 occurrences. Les textes retenus dans ce corpus présentent une hétérogénéité certaine : interviews radiophoniques, interviews télévisuelles, interviews faisant l’objet d’un article journalistique, discours de dirigeant ou encore lettres aux actionnaires. Alors que notre analyse sur le discours patronal n’en était qu’à ses débuts, il nous avait paru intéressant de favoriser la variété et l’exhaustivité des dispositifs de communication par lesquels les grands patrons s’expriment. Sélectionner des textes en particulier parmi les différents modes de communication patronaux n’aurait pu se réaliser qu’au gré de choix a priori et n’aurait pas satisfait notre objectif : dégager, si nous arrivions à l’identifier, les caractéristiques d’un genre, le ‘discours patronal’, et mettre au jour les spécificités propres à chaque locuteur. Ainsi, les principaux critères ayant présidé à la constitution du corpus ont été l’homogénéité géographique – entreprises françaises et médias nationaux français, l’homogénéité temporelle – discours produits au cours des années 2000 et 2001, et l’homogénéité de statut du locuteur (dirigeant / PDG) et de son entreprise (grandes entreprises représentatives du marché français, pour l’essentiel cotées en bourse, publiques, privées ou mixtes). Les holdings par exemple, qui utilisent d’autres moyens de communication, ont été écartées. Seules les productions patronales ont fait l’objet d’un traitement quantitatif, les interventions des journalistes, en situation d’interview ont été par exemple également écartées. De façon à permettre une étude comparée des discours de chaque patron, ce corpus a été catégorisé en autant de patrons représentés, en quinze sous-corpus. Le traitement du corpus a exploité dans une première étape une méthode quantitative de type lexicométrique (Lebart, Salem, 1994) complétée, une fois les spécificités du 1 Département de Sciences du Langage ; garric@univ-tours.fr, leglise@univ-tours.fr halshs-00292407, version 1 - 1 Jul 2008 Manuscrit auteur, publié dans "Linguistique de corpus, Geoffrey Williams (Ed.) (2005) 101-113"