Extension du codeur SPIHT au codage d’images hyperspectrales J.-L. Gutzwiller 1 , M. Hariti 2 , M. Barret 1 , E. Christophe 2 , C. Thiebaut 2 et P. Duhamel 3 1 SUPELEC, Équipe IMS, 2, rue É. Belin, 57070 Metz Technopôle 2 CNES, 18 avenue Edouard Belin, 31401 Toulouse Cedex 9 3 CNRS, SUPELEC-LSS, 3 rue Joliot-Curie, Plateau de Moulon, 91192 Gif-sur-Yvette. {jean-louis.gutzwiller, michel.barret}@supelec.fr, mohamed.hariti@liris.cnrs.fr, {carole.thiebaut, emmanuel.christophe}@cnes.fr, pierre.duhamel@lss.supelec.fr Résumé Le codage par transformée et décomposition en ondelettes (DO) est efficace pour coder les images hyperspectrales en suivant le standard JPEG2000 (partie 2). Toutefois la complexité du codeur EBCOT et de l’algorithme d’alloca- tion optimale entre composantes ne permet pas son utili- sation à bord d’un satellite aujourd’hui. Nous présentons une extension de l’algorithme SPIHT qui permet un codage progressif en qualité d’images hyperspectrales ayant subi une DO 2D par composantes et une transformation linéaire entre elles. Les performances obtenues (PSNR versus dé- bits) sont légèrement inférieures à celles de JPEG2000, pour une complexité significativement plus faible. Mots clefs Compression d’images hyperspectrales, codeur 3D par arbres, SPIHT-3D. 1 Introduction Pour traiter et stocker le volume de données issues de capteurs d’images hyperspectrales embarqués dans les sa- tellites de nouvelle génération, le développement d’algo- rithmes de compression capables d’exploiter les redon- dances, spectrale et spatiale, de ces données est nécessaire. Une image hyperspectrale X est constituée de N compo- santes X 1 ,..., X N . Chaque composante est une photogra- phie 2D (ayant N ℓ lignes et N c colonnes) d’une même scène prise dans une bande spectrale très étroite, allant du visible au proche infrarouge en général. Les différentes composantes correspondent à différents intervalles de lon- gueur d’ondes λ et sont rangées par λ croissant ou dé- croissant. Ainsi pour un point de la scène en position (i, j ), la séquence X 1 (i, j ),...,X N (i, j ) correspond à un échantillonnage fin de son spectre. Dans la suite, suivant le contexte, X i désignera une image 2D de dimension N ℓ × N c ou une matrice ligne de dimension L = N ℓ N c obtenue en balayant tous les pixels de la composante dans un ordre préétabli (par exemple ligne par ligne). De même, X désignera une matrice de dimension N ×L dont la i-ème ligne vaut X i ou un tenseur d’ordre 3 d’éléments X(i, j, k) avec 1 ≤ i ≤ N ℓ , 1 ≤ j ≤ N c et 1 ≤ k ≤ N . Le codage en sous-bandes et par transformée est efficace pour réduire les redondances, spatiale et spectrale, de ces données [1, 2]. Parmi les différents schémas de compres- sion qui existent, nous étudions celui qui consiste, lors du codage, à centrer chaque composante de l’image en lui re- tranchant sa valeur moyenne (pour simplifier les expres- sions, nous supposerons ces N moyennes nulles dans la suite), puis à appliquer la même décomposition en onde- lettes (DO) 2D à chaque composante X i , pour réduire la redondance spatiale, et une transformation linéaire A entre composantes, pour réduire la redondance spectrale. Le ré- sultat de la DO appliquée à toute l’image X peut se mettre sous la forme XW T , où T désigne la transposée et W la matrice de la DO. Les coefficients transformés sont alors les éléments de la matrice Y = AXW T . Ces derniers sont ensuite quantifiés et codés. Au décodage, en notant Y la matrice des coefficients transformés quantifiés, une ap- proximation de l’image X est construite en appliquant les transformations inverses : X = A −1 YW −T . Ce schéma de compression est dit séparable car l’ordre dans lequel la DO et la transformation A sont appliquées ne change pas le résultat. Le schéma séparable est compatible avec la partie 2 du standard JPEG2000 [3] et avec les recom- mandations du CCSDS pour le codage embarqué d’images satellitaires [4]. Associé au codeur EBCOT [5] et à son al- gorithme complexe d’allocation optimale de débits entre composantes, il donne les meilleures performances recon- nues à ce jour [6, 2] à moyens et hauts débits, quand il est utilisé avec la DO 9/7 de Daubechies et la transformation de Karhunen-Loève (TKL). Il est bien connu que généralement la TKL n’est pas opti- male en codage par transformée, quand les données ne sont pas gaussiennes. Une précédente étude [7] a montré que, sans l’hypothèse de gaussianité, une transformation opti- male, notée OrthOST pour Orthogonal Optimal Spectral Transform dans la suite, peut être calculée par des algo- rithmes d’analyse en composantes indépendantes modifiés et que, sur des images réelles, elle donne de meilleures per- formances que la TKL à bas, moyens et hauts débits. L’in- convénient majeur des OrthOST est la grande complexité des algorithmes permettant de les calculer, ce qui rend im-