APPLICATIONS LINGUISTIQUES MULTILINGUES DESTINEES AU WEB : APPORT DES GRAMMAIRES CATEGORIELLES Ismaïl Biskri Département de mathématiques et d'informatique Université du Québec à Trois-Rivières C.P. 500, Trois-Rivières, Québec, Canada, G9A 5H7 ismail.biskri@uqtr.ca Résumé L'essor vertigineux que connaissent le World Wide Web et l'Internet ces dernières années génère une forte demande pour les applications informatiques multilingues que ce soit au niveau du web sémantique ou au niveau de la construction et de la gestion des ontologies ou au niveau de la recherche d’information, etc. . Cette demande représente un formidable défi pour les applications nécessitant une analyse de linguistique-informatique des textes électroniques. Nous défendons, dans cet article, l'idée que les grammaires catégorielles en général et la Grammaire Catégorielle Combinatoire Applicative en particulier permettent d'aborder efficacement cette problématique en clarifiant ce qui pourrait être universel (du moins pour un ensemble non-négligeable de langues) et ce qui devrait être spécifique à une langue. Notre présentation se fera par rapport à trois langues que sont le français, l’anglais et l’arabe. Mots clefs Traitement multilingue ; Grammaire Catégorielle Combinatoire Applicative ; logique combinatoire ; déduction naturelle ; interprétation sémantique fonctionnelle. 1. Introduction Le développement accéléré du Web au cours de la dernière décade a permis de prendre conscience des possibilités offertes par une telle technologie mais auss i des limites induites par certains choix faits au départ. En effet, bien qu'initialement il semblait normal d'adopter la langue anglaise comme interlingua du Web, l'avènement de nouvelles communautés d'utilisateurs non anglophones, a depuis rendu possible la cohabitation de divers documents publiés dans diverses langues. Cette pression du multilinguisme amène les développeurs de logiciels destinés au Web à concevoir des produits carrément multilingues ou, au moins, faciles à adapter à d'autres langues que celle considérée au départ. Ces logiciels sont principalement basés sur des approches dites numériques ou statistiques. Ils sont généralement associés aux domaines de recherche suivants (Nie, Jin, 2003) (Garcia Adeva & ali., 2005) : la recherche ou l'extraction d'information (information retrieval), le forage de données (text mining), l'extraction des connaissances (knowledge extraction), la gestion des connaissances (knowledge management), la production automatique de résumés (text summarization), la catégorisation de textes (text categorization)), la traduction automatique (machine translation) etc. Face aux limites avérées de l’approche numérique, la recherche s’intéresse de plus en plus à une autre classe d'applications faisant appel à des données linguistiques pour lesquelles l’adaptation à d'autres langues pose plusieurs difficultés. Ces applications, que nous désignerons sous le vocable d'applications d'informatique-linguistique (p.ex. un programme faisant appel à un module d'analyse sémantique, ou à un module d’analyse conceptuelle),