La constitution d'un corpus vidéo-enregistré de réunions professionnelles. Carnet de recherche Jérôme JACQUIN & Sabrina ROH Université de Lausanne The paper documents the constitution of a video-recorded corpus of work meetings, accumulating 19 events, 23h of recording and 45 participants. This research log is not intended to be a manual or a model, but rather an account of the challenges, problems, and solutions that have been found, with the aim of drawing attention to some aspects and dimensions where particular vigilance is required, whether being the quality of the data to be gathered, the efficiency of the adopted procedures, or the respect of ethical and legal standards. After general considerations on the research project and its theoretical underpinnings regarding the data to be considered, the paper describes the different stages in the constitution of the corpus: prospecting, recording, assembling, transcribing, and sharing. 1. Introduction La présente contribution se présente comme un carnet de recherche visant à documenter la constitution d'un corpus de réunions professionnelles vidéo- enregistrées, pour un total de 19 événements, 23 heures d'enregistrement et 45 participant·e·s. Il ne s'agit pas ici de proposer un manuel ou un modèle, avec des recettes toutes faites à appliquer, mais plutôt de décrire les défis, problèmes et solutions trouvées, dans l'idée d'attirer l'attention des personnes intéressées sur certains points et aspects où une vigilance nous semble de mise, qu'il s'agisse de la qualité des données visée, de l'efficacité des procédures mises en œuvre ou du respect des normes éthiques et légales. Le corpus dont il est question participe d'un projet de recherche financé par le Fonds National Suisse de la recherche [PZ00P1_168033] et portant sur l'étude multimodale de marqueurs épistémiques du français (p. ex. JE PENSE, JE SAIS, PEUT-ÊTRE) et de leur relation aux positions épistémiques (savoir, ne pas savoir, douter) prises par les participant·e·s dans des interactions institutionnelles se déroulant dans des contextes associatifs ou professionnels. Débuté en été 2017, le projet a notamment pour objectif de constituer un corpus de réunions d'entreprise à contraster avec des données documentant des débats publics et télévisés (n=10, env. 11h d'enregistrements). La base de données CLAPI (Corpus de LAngue Parlée en Interaction 1 ) hébergée à l'ENS- 1 Selon son propre descriptif, "CLAPI […] est une banque de données multimédia de corpus enregistrés en situation réelle, dans des contextes variés: interactions professionnelles, Publié dans Revue Tranel (Travaux neuchâtelois de linguistique) 70, 89-106, 2018, source qui doit être utilisée pour toute référence à ce travail