Extension de l’algorithme Apriori et des r`egles d’association aux cas des donn´ees symboliques diagrammes et intervalles Filipe Afonso *,** , Edwin Diday * * Ceremade-Universit´e Paris Dauphine, Place du Mar´echal de Lattre de Tassigny, 75775 Paris Cedex 16, France afonso@ceremade.dauphine.fr, diday@ceremade.dauphine.fr ** Lamsade-Universit´e Paris Dauphine esum´e. Nous traitons l’extension de l’algorithme Apriori et des r`egles d’association aux cas des donn´ees symboliques diagrammes et intervalles. La m´ethode propos´ee nous permet de d´ecouvrir des r`egles d’association au niveau des concepts. Cette extension implique notamment de nouvelles efinitions pour le support et la confiance afin d’exploiter la structure symbolique des donn´ees. Au fil de l’article, l’exemple classique du panier de la m´enag`ere est d´evelopp´e. Ainsi, plutˆot que d’extraire des r`egles entre diff´erents articles appartenant `a des mˆemes transactions enregistr´ees dans un magasin comme dans le cas classique, nous extrayons des r`egles d’asso- ciation au niveau des clients afin d’´etudier leurs comportements d’achat. 1 Introduction L’algorithme Apriori d´efini dans (Agrawal et Srikant 1994) a pour but d’extraire des r`egles d’association `a partir de donn´ees classiques issues du panier de la m´enag`ere. Les r`egles sont du type laitbeurre traduisant le fait que ”si du lait est pr´esent dans le panier de la m´enag`ere alors il y a aussi du beurre”. D`es lors, des travaux ont exploit´e la complexit´e des donn´ees afin d’acc´el´erer l’ex´ecution de l’algorithme Apriori ou d’enrichir les r`egles d’association. Ainsi, (Wang et al. 2000) et (Cai et al. 1998) d´ecouvrent des r`egles pond´er´ees par l’importance d’un mˆeme article dans le panier alors que (Srikant et al. 1997) et (Han et Fu 1995) exploitent les relations de taxonomie dans les donn´ees. De plus, les r`egles d’association sont ´etendues aux donn´ees quantitatives et intervalles, notamment (Srikant et Agrawal 1996) et (Miller et Yang 1997) alors que dans (Kuok et al. 1998), les auteurs s’int´eressent aux ensembles flous. Ainsi, cet article s’inscrit dans le prolongement de ces travaux. Nous ´etendons l’algorithme Apriori aux cas des variables symboliques `a valeurs diagrammes et intervalles afin d’extraire des r`egles d’association non plus au niveau des individus mais au niveau des concepts. Cette extension implique notamment de nouvelles d´efinitions pour le support et la confiance afin de tirer parti de la structure symbolique des donn´ees. Finalement, nous terminons par une application o` u nous ´etudions les comportements d’achat dans des magasins non plus au niveau des transactions comme dans le cas classique mais au niveau des clients. Pour chaque client, nous agr´egeons les articles achet´es grˆace `a un diagramme construit avec la proportion de chaque article par rapport aux achats totaux du client et nous enrichissons nos r`egles par l’ajout d’une variable intervalle sur les montants d´epens´es par le client. RNTI-E-3 483