Estimation de cartes de disparit´ e bas´ ee sur l’algorithme revisit´ e d’appariement de blocs pour la compression d’images st´ er´ eoscopiques Aysha KADAIKAR , Gabriel DAUPHIN , Anissa MOKRAOUI Laboratoire de Traitement et Transport de l’Information Institut Galil´ ee, Universit´ e Paris 13, Sorbonne Paris Cit´ e 99 avenue Jean-Baptiste Cl´ ement, 93430 Villetaneuse, France kadaikar@univ-paris13.fr, gabriel.dauphin@univ-paris13.fr anissa.mokraoui@univ-paris13.fr esum´ e– Cet article traite du probl` eme de l’estimation de cartes de disparit´ e en vue de la compression d’images st´ er´ eoscopiques. L’algorithme classique d’appariement de blocs associe ` a chaque bloc de la vue ` a pr´ edire une disparit´ e. Ces disparit´ es sont choisies de fac ¸on ` a minimiser la distorsion globale ´ evalu´ ee entre la vue originale et sa pr´ ediction. Pour une distorsion minimale, le coˆ ut binaire de la carte estim´ ee peut cependant s’av´ erer ´ elev´ e. Dans le but d’assurer un bon compromis d´ ebit-distorsion, nous proposons une m´ ethode d’estimation de carte bas´ ee sur une m´ etrique conjointe entropie-distorsion. Partant d’une carte de disparit´ e de r´ ef´ erence, notamment celle estim´ ee par l’algorithme classique d’appariement de blocs, nous proposons de modifier au fur et ` a mesure cette carte tant que les modifications envisag´ ees r´ eduisent davantage la m´ etrique conjointe. La nouvelle carte estim´ ee est ensuite trait´ ee autant de fois qu’il est possible d’obtenir une diminution de la m´ etrique conjointe. De plus, une strat´ egie de mise ` a jour de la m´ etrique conjointe est propos´ ee de fac ¸on ` a ne pas affecter la complexit´ e de calcul de notre algorithme. Les simulations, r´ ealis´ ees sur la base d’images st´ er´ eoscopiques Middlebury, montrent une am´ elioration significative en termes de ebit-distorsion compar´ ee ` a l’algorithme classique d’appariement de blocs. Abstract – This paper deals with the problem of estimating disparity maps for stereoscopic image compression. The traditional block-matching algorithm associates a disparity to each block of the view to be predicted. These disparities are selected so that they minimize the distortion computed between the original and the predicted view. However the binary cost involved by the resulting disparity map minimizing the distortion may be high. In order to ensure a good bitrate-distortion trade-off, we propose a map estimation method based on a joint entropy-distortion metric. The proposed approach relies on a reference solution, initially taken as the disparity map computed by the traditional block-matching algorithm, which is modified successively as long as the proposed changes reduce the entropy-distortion metric. The new estimated disparity map is then processed again as long as a decrease in the joint metric is achieved. In addition, an update strategy of the joint metric is proposed so as the computational complexity of the algorithm is not affected. Simulations, conducted on stereoscopic images from Middlebury dataset, show that significant gains are achieved in terms of rate-distortion compared to the traditional block-matching algorithm. 1 Introduction Ces derni` eres d´ ecennies ont vu ´ emerger un bon nombre d’ap- plications offrant ` a l’utilisateur une impression de profondeur, citons par exemple la TV-3D, les jeux vid´ eos immersifs ou en- core la visioconf´ erence en 3D [1, 2]. Cette impression de pro- fondeur n’est rien d’autre qu’une illusion d’optique lorsque deux vues d’une mˆ eme sc` ene sont pr´ esent´ ees ` a un observa- teur. Plus un objet d’une sc` ene apparaˆ ıt distant (impression de grande profondeur), plus il est rep´ er´ e dans les vues ` a des endroits distants. L’ensemble des d´ eplacements spatiaux des emes objects pr´ esents dans les deux vues forme une carte de disparit´ e. Etant donn´ e que les deux vues sont ressemblantes, trouver une technique de codage pour exploiter les redondances inter-vues est aujourd’hui un sujet de recherche d’autant plus important que les applications r´ ecentes semblent pr´ esenter un int´ erˆ et croissant. La compression d’images st´ er´ eoscopiques s’appuie assez sou- vent sur un sch´ ema de codage par compensation de disparit´ e. L’une des deux vues, par exemple la gauche, est choisie comme vue de base pour ˆ etre comprim´ ee ind´ ependamment de la vue droite. Une carte de disparit´ e est estim´ ee puis comprim´ ee selon un codage entropique [4, 5]. La vue droite est alors pr´ edite en utilisant la carte estim´ ee ainsi que la vue de base. Avant sa com- pression, une image r´ esiduelle est calcul´ ee entre l’image droite originale et sa pr´ ediction. Il s’en suit alors que la carte estim´ ee joue un rˆ ole primordial sur les performances de la m´ ethode de compression. L’Algorithme de Mise en correspondance de Blocs (AMB) (ou d’appariement de blocs) est assez souvent exploit´ e pour es- timer la carte de disparit´ e. Cette derni` ere, constante par bloc (c.a.d. une mˆ eme disparit´ e pour tous les pixels d’un bloc de l’image), permet de r´ eduire de mani` ere importante le coˆ ut bi- naire compar´ e aux cartes denses (c.a.d. une disparit´ e par pixel). L’AMB s´ el´ ectionne les disparit´ es qui minimisent une m´ etrique de dissimilarit´ e calcul´ ee lors de l’appariement des blocs, telles que la somme des carr´ ees des diff´ erences ou la somme des diff´ erences absolues ´ evalu´ ees entre les intensit´ es des blocs ` a apparier [3]. Pour r´ eduire le coˆ ut du codage de la carte de