Une stratégie adaptative pour la découverte des motifs fréquents maximaux Frédéric Flouvat * Fabien De Marchi ** Jean-Marc Petit *** Laboratoire LIMOS, UMR CNRS 2239 Université Blaise Pascal - Clermont-Ferrand II Campus Universitaire des Cézeaux, 63 177 Aubière cedex, France * flouvat@isima.fr ** demarchi@math.univ-bpclermont.fr *** jmpetit@math.univ-bpclermont.fr RÉSUMÉ. Le problème de l’énumération de la bordure positive des motifs fréquents (ou motifs fréquents maximaux) dans une base de données transactionnelle est un problème classique en fouille de données avec de nombreuses applications. Dans cet article, nous proposons d’adap- ter aux motifs fréquents un algorithme conçu pour découvrir les dépendances d’inclusion dans une base de données. La stratégie de parcours est la suivante : (1) recherche exhaustive des mo- tifs fréquents de taille plus petite que k (valeur fixée par l’utilisateur), (2) caractérisation par dualisation de la bordure positive optimiste à partir des motifs non fréquents trouvés jusqu’au niveau k et (3) parcours adaptatif de l’espace des solutions restant à parcourir, i.e. "entre" les motifs fréquents trouvés avant dualisation et la bordure positive optimiste. Une mesure d’erreur est proposée afin d’évaluer "la qualité" de chacun des éléments de la bordure positive optimiste afin de guider la suite du parcours. Un effet de bord intéressant de ce travail est qu’il permet de formaliser les heuristiques présen- tées dans les références phares du domaine comme P incerSearch et GenM ax. Ce travail est en cours, nous ne donnerons donc que quelques éléments d’appréciation sur les premiers résultats expérimentaux obtenus sur des données publiques. MOTS-CLÉS : fouille de données, motifs fréquents maximaux, bordure positive optimiste, parcours adaptatif.