Approximation des cubes OLAP et génération de règles dans les entrepôts de données, Sami Naouali, Rokia Missaoui e-TI, Revue électronique des Technologies de l’Information. http://www.revue-eti.net, Numéro 2. 2006. ISSN 1114-8802 1 Approximation des cubes OLAP et génération de règles dans les entrepôts de données OLAP Cube Approximation and Rule Generation in Data Warehouses Sami Naouali LARIM, Université du Québec en Outaouais, Canada, sami.naouali@uqo.ca. Rokia Missaoui LARIM, Université du Québec en Outaouais, Canada, rokia.missaoui@uqo.ca. Résumé Cet article décrit une nouvelle approche d’approximation des résultats d’une requête OLAP soumise à un entrepôt de données. Cette approche est basée sur une adaptation de la théorie des ensembles approximatifs (rough set theory) aux données multidimensionnelles et offre de nouvelles possibilités d’exploration et d’extraction de connaissances à parti r des cubes OLAP. L’objectif de cet article est d’intégrer des outils d’approximation dans les entrepôts de données dans le but de produire de nouvelles vues que l’on peut par la suite analyser et explorer en faisant appel à des opérateurs OLAP et/ou des algorithmes d’extraction de connaissances. Cette intégration permet alors à l’utilisateur de travailler soit en mode "strict" (ou restreint) en utilisant une approximation basse du cube OLAP, ou en mode "relâché" en utilisant une approximation haute de ce dernier. Le premier mode est utile dans le cas où la réponse à la requête est volumineuse, permettant ainsi à l’utilisateur de focaliser son attention sur un ensemble réduit de cellules fortement similaires. Le deuxième mode est utile dans le cas d’une requête retournant un ensemble réduit de cellules, permettant ainsi de relâcher les conditions de la requête afin d’élargir le volume du résultat. Abstract This paper presents a new approach toward approximate query answering in data warehouses. The approach is based on an adaptation of rough set theory to multidimensional data, and offers cube exploration and mining facilities. The objective of this work is to integrate approximation mechanisms and associated operators into data cubes in order to produce views that can then be explored using OLAP or data mining techniques. The integration of data approximation capabilities with OLAP techniques offers additional facilities for cube exploration and analysis. The proposed approach allows the user to work either in a restricted mode using a cube lower approximation or in a relaxed mode using cube upper approximation. The former mode is useful when the query output is large, and hence allows the user to focus on a reduced set of fully matching tuples. The latter is useful when a query returns an empty or small answer set, and hence helps relax the query conditions so that a superset of the answer is returned.