SETIT 2009 5 th International Conference: Sciences of Electronic, Technologies of Information and Telecommunications March 22-26, 2009 – TUNISIA - 1 - Identification du Locuteur par Système Hybride GMM-SMO Siwar ZRIBI BOUJELBENE *,*** , Dorra BEN AYED MEZGHANI **,*** et Noureddine ELLOUZE *** * Département Informatique, FSHST, Tunisie siwarzribi@gmail.com ** Département Génie Logiciel des Systèmes d’Information, ISI, Tunisie Dorra.mezghani@isi.rnu.tn *** Département Génie électrique, ENIT, Tunisie N.ellouze@enit.rnu.tn Résumé: Dans cet article, nous présentons un nouveau système hybride GMM-SMO pour l’identification du locuteur en mode indépendant du texte. Ce système présente la capacité de modélisation multi-gaussiennes (GMM) et l’efficacité de décision des supports vecteurs machines de type Optimisation par Minimisation Séquentielle (SMO). Des nouvelles représentations de l’espace de caractéristiques portées sur une modélisation GMM des locuteurs basées sur l’algorithme Expectation Maximisation (EM) sont déterminées. Ces nouvelles représentations constituent les vecteurs d’entrée pour entraîner les supports vecteurs machines par l’algorithme de type SMO. L’algorithme SMO permet d’étudier la similarité des caractéristiques afin d’apporter une décision d’identification. Mots-clés: reconnaissance automatique du locuteur, Modèle de Mélange Gaussien (GMM), Support Vecteurs Machines, algorithme Optimisation par Minimisation Séquentielle (SMO). INTRODUCTION De nombreux travaux ont porté sur le problème de reconnaissance automatique du locuteur. L’extraction des caractéristiques ainsi que les méthodes de classification sont les tâches les plus importantes et les plus délicates dans le processus de reconnaissance de la parole. Il est bien connu que les vecteurs des paramètres extraits directement du signal de parole contiennent simultanément un certain nombre d'informations sur le canal, la parole et les locuteurs. Il est donc difficile d’extraire uniquement les informations des locuteurs directement de ces vecteurs sans passer par une modélisation. Il s’agit donc dans cet article de construire un système hybride GMM- SMO pour l’identification du locuteur en mode indépendant du texte permettant d’étudier la similarité des caractéristiques afin d’apporter une décision d’identification. Nous proposons en effet, des nouvelles représentations des données basées sur une modélisation multi-gaussiennes GMM des locuteurs basé sur l’algorithme Expectation Maximisation (EM). Ces nouvelles représentations constituent les vecteurs d’entrée pour l’apprentissage des Supports Vecteurs Machines par l’algorithme Optimisation par minimisation séquentielle (SMO) en phase de décision. Notre article est organisé comme suit : nous présentons, dans la section 1, une description des systèmes de reconnaissance automatique du locuteur. Nous décrivons, dans la section 2, la théorie des Supports Vecteurs Machines suivie par une description de l’algorithme SMO. Nous présentons, dans la section 3, notre système hybride GMM-SMO ainsi que le protocole expérimental. Nous abordons, dans la section 4, l’analyse des résultats. 1. Systèmes de reconnaissance automatique du locuteur RAL La Reconnaissance Automatique du Locuteur (RAL) est une des disciplines du traitement du signal de la parole. Elle consiste à reconnaître l’identité d’un individu à partir de sa voix [DOD 85], [ROS 91]. 1.1. Principales tâches en reconnaissance automatique du locuteur L'identification automatique du locuteur et la vérification automatique du locuteur sont les deux tâches les plus répandues dans le domaine de RAL.