Troisième Congrès Tunisien de Mécanique COTUME’2014 Sousse 24-26 Mars 2014 Page 1/2 Résumé : dans ce papier on étudie les effets d’élimination des valeurs aberrantes et de leurs imputations sur la sélection des indicateurs statistiques et la classification d’un défaut d’injection. Le défaut est simulé dans un moteur Diesel à combustion interne à six cylindres. Quatre méthodes de classification supervisée sont exploitées pour la discrimination des trois classes de défaut. Les résultats obtenus montrent que l’élimination des valeurs aberrantes et leurs imputations ont amélioré la classification du défaut pour un nombre des variables fini et surtout pour le classi- ficateur k-plus proches voisins. Mots clefs : Valeurs aberrantes, imputation, classification supervi- sée, défaut d’injection, moteur Diesel. 1. Introduction Dans le domaine de classification de défauts par analyse vibratoire, on rencontre plusieurs problèmes. Parmi ces problèmes, on cite les deux problèmes rencontrés lors du traitement des indicateurs statistiques calculés à partir des signaux temporels bruts et qui sont : l’existence des valeurs aberrantes (VA) dans les bases de données à cause de la fluctuation de la vitesse de rotation instantanée du vilebre- quin du moteur et l’imputation des valeurs manquantes (VM) après élimination de ces VA. Une valeur aberrante est une observation qui semble remar- quablement écarter par rapport à l’ensemble des autres membres de l’échantillon dans lequel elle apparaît. Pour identifier les VA, on peut utiliser soit une méthode gra- phique pour s’en distinguer (boîte à moustaches, diagramme en bâtons ou en rectangles, graphiques des quantiles, histo- gramme, nuage de points, etc.) soit un test statistique (test de Grubbs, test de Dixon, test de Rosner, test de Fisher, test de Cochran, test Q, etc.) permettant de justifier l’élimination de la valeur aberrante avec un risque de se tromper α. Une attitude classique, que l’on rencontre fréquemment, consiste à éliminer ces VA. Dans ce cas, il y a quatre possibilités pour traiter des données avec valeurs manquantes (VM) : ne rien faire, utiliser uniquement les enregistrements pour les- quels les données sont complètes, utiliser une méthode de repondération ou imputer une valeur. La méthode d'imputation des VM consiste à produire une valeur artificielle pour remplacer la valeur manquante. Cou- ramment, on utilise l'imputation par la moyenne ou le mode, par régression, par le plus proche voisin, etc. L’objectif de ce papier est d’étudier les effets d’élimination des valeurs aberrantes et de leurs imputations sur la classifi- cation supervisée d’un défaut d’injection en trois classes. 2. Méthodologie Pour accomplir cet objectif, on a choisi trois méthodes simples à exploiter et fréquemment utilisées dans le do- maine de détection des VA. La première méthode (M1) se repose sur le test de Grubbs [1]. La deuxième méthode (M2) vise l’identification des VA dans un échantillon univa- rié qui suit une loi normale en utilisant la méthode d’analyse de la variance [2]. La troisième méthode (M3) est un test permettant la détection des VA, dans un échantillon multi- varié et qui suit la loi normale, pour un seuil de risque α en %. Ce test se base sur la méthode de Wilks [3]. Afin de traiter des bases de données complètes et ayant un vraisemblablement cohérents, les VA, découvertes par les trois méthodes de détection M1, M2 et M3, doivent être éliminées et imputées par d’autres valeurs. Après examen de plusieurs méthodes d’imputation on a retenu la méthode d’imputation par les k-plus proches voisins (I-kppv) [4]. Une fois les VM sont imputées, on passe à l’extraction des indicateurs. Dans le domaine temporel, cinq indicateurs sta- tistiques sont choisis. Ces indicateurs sont : l’écart entre le 5 ème percentile et le 95 ème percentile (5P-95P), la valeur ef- ficace (RMS), le coefficient d’asymétrie (Skewness), le coef- ficient d’aplatissement (Kurtosis) et l’entropie (SE). Afin de sélectionner les variables selon leurs capacités de séparer les classes de défauts tout en réduisant leurs nombre, on a utilisé le programme de sélection pas-à-pas des variables développé par Ftoutou et al. [5]. Pour discriminer les trois classes de notre défaut, quatre classificateurs supervisés sont choisis : Deux classificateurs paramétriques, qui sont le classificateur linéaire de Bayes (LC) et le classificateur quadratique de Bayes (QC) et deux classificateurs non paramétriques, qui sont le k-plus proches voisins (k-ppv) et le réseau de neurones perceptron multi- couches à rétropropagation (MLP). 3. Etude expérimentale Dans cette étude, un moteur Diesel à injection directe 4 temps, ayant 6 cylindres en ligne, installé sur un banc d’essai est utilisé. Ce moteur a une puissance de 250 kW à 2200 tr/min, un moment de torsion maximal de 1400 N.m à 1250 tr/min et une cylindrée de 9,6 litres. Les signaux de vibration ont été mesurés par un accéléromètre piézoélec- trique de type B & K 4384 fixé par une embase collée au milieu du bloc moteur juste au-dessous du joint culasse. La sortie de l’accéléromètre est amplifiée par un amplificateur de charge de type B & K 2646. La sortie de l’amplificateur est connectée à la carte d’acquisition NI USB 9233 qui est lui-même liée à un PC portable. En exploitant un signal de référence, détecté par un capteur inductif, qui a pour objec- tif de détecter le point mort haut au cours de la phase de la combustion dans le cylindre 1, chaque signal de vibration est débité en 250 segments (notés S1). Chaque segment a une longueur d’un cycle moteur (2 tours de vilebrequin). De même, un autre segment (S2) de longueur 43 points a été débité au voisinage des phénomènes d’injection et de la combustion. Le défaut d’injection est simulé dans le cy- Etude des effets de l’élimination et d’imputation des valeurs aberrantes sur la classification d’un défaut d’injection dans un moteur Diesel E. Ftoutou 1 , M. Chouchane 2 , N. Besbès 3 1 Université de Monastir, ENIM, LGM, ezzeddine.ftoutou@edunet.tn. 2 Université de Monastir, ENIM, LGM, mnaouar.chouchane.enim.rnu.tn.