Revue. Volume X – n° x/année, pages 1 à X Modélisation multidimensionnelle de documents XML centrés-données Yasser Hachaichi* — Jamel Feki** — Hanene Ben-Abdallah** Multimedia, InfoRmation systems and Advanced Computing Laboratory (MIRACL) *Départ. Méthodes quantitatives et informatique, Institut Supérieur d'Administration des Affaires de Sfax ** Départ. Informatique, Faculté des Sciences Economiques et de Gestion de Sfax Route de l’Aérodrome km 4, B.P. 1088, 3018 Sfax, Tunisie {Yasser.Hachaichi, Jamel.Feki, Hanene.BenAbdallah}@ fsegs.rnu.tn ABSTRACT. Today's international nature of commerce forced the opening of corporal information systems (IS) to accept data required for both transactional and decisional processes. To ensure the interoperability of so opened IS, XML has been adopted as a de facto standard format for exchanged data. In order to accommodate this data format in the design of decision support systems, we propose in this paper an automatic method for the design of data mart schemas from XML documents. The proposed method has the merit of automatically identifying all multidimensional elements, classifying them in terms of their analytical potential, and tracing them to the source which facilitates the definition of ETL procedures. For this, our method analyzes the DTD of the source documents and consults a sample of XML documents to determine typing information when needed. It relies on a set of identification rules that are independent of the domain of the XML documents. Furthermore, being automatic, it is supported by a CASE toolset that facilitates its exploitation. RÉSUMÉ. La mondialisation du commerce a forcé l’ouverture des systèmes d’information (SI) des entreprises pour accueillir des données utiles à leurs processus transactionnels et décisionnels. Pour assurer l’interopérabilité des SI ainsi ouverts, XML est adopté comme format standard de fait pour les données échangées. Afin de tenir compte de ce format dans la conception des systèmes d’information décisionnels, nous proposons dans cet article une méthode automatique de construction de schémas de magasins de données à partir de documents XML centrés données. Cette méthode a le mérite d’identifier automatiquement tous les éléments multidimensionnels, de les classer selon leur potentiel analytique, et de les lier à la source facilitant ainsi la définition des procédures ETL. Pour ce faire, elle opère sur la DTD des documents sources et consulte un échantillon de documents XML pour déterminer des informations de typage en cas de besoin. Elle utilise un ensemble de règles d’identification des éléments multidimensionnels, indépendants du domaine des documents XML. En outre, elle est soutenue par un outil CASE facilitant son exploitation. MOTS-CLÉS : Système d’information décisionnel, conception automatique, magasin de données, schéma en étoile, modèle multidimensionnel, XML, DTD. KEYWORDS: Decision support system, automatic design, data mart, star schema multidimensional model, XML, DTD.