APLICACIÓN DE TÉCNICAS ICA TEMPORALES Y ESPACIALES PARA LA SEPARACIÓN Y LOCALIZACIÓN DE FUENTES Xavier Sevillano, Joan Claudi Socoró, José Antonio Morán, Rosa Maria Alsina Departamento de Comunicaciones y Teoría de la Señal Enginyeria i Arquitectura La Salle – Universitat Ramon Llull {xavis,jclaudi,moran,ralsina}@salleURL.edu ABSTRACT This paper deals with the application of independent component analysis (ICA) techniques on a set of data obtained from a group of microphones uniformly distributed in a room. We take advantadge of the temporal and spatial structure of the data to perform blind source separation and also to locate the position of the sources. We use a basic model for simulating the propagation of the signals in an anechoic room to generate the data, and some results obtained from simulations of temporal and spatial ICA processing techniques applied to the model are presented. 1. INTRODUCCIÓN El análisis de componentes independientes (Independent Component Analysis ó ICA) es una técnica que permite hallar factores (o componentes) independientes que forman parte de un conjunto de datos multidimensional. Una de las aplicaciones de ICA es la separación ciega de fuentes; este proceso se fundamenta en la independencia estadística de las señales, ya que tienen procesos generativos totalmente independientes. El problema que intenta solucionar ICA [1] suele formularse en notación matricial, mediante la siguiente ecuación: (1) s A x ⋅ = donde s es el vector que contiene las señales independientes originales, A es la denominada matriz de mezcla (desconocida para nosotros), y x es el vector que contiene las señales mezcladas. El problema consiste en recuperar el vector s disponiendo, únicamente, del vector x; es decir, el objetivo es llegar a calcular una matriz , de modo que podamos recuperar las señales independientes originales como: 1 A W − = (2) x W s ⋅ = [ x x K = x 1.1. El modelo de trabajo y su aplicación El objetivo del estudio realizado es lograr la separación y localización de diferentes fuentes situadas en diversos puntos de una sala. Una posible aplicación de estas técnicas es su utilización en sistemas de microfonía “inteligente” en auditorios o salas destinadas a la realización de videoconferencias, casos en los que pueda ser útil conocer la situación de los locutores; la ubicación de fuentes puede servir de complemento a estructuras microfónicas de procesado en array (beamforming) o para la orientación automática de cámaras. Para ello, repartidos de modo uniforme a lo largo y ancho de la sala, habrá un conjunto de micrófonos que captarán las señales emitidas por las fuentes. Esta situación se ha simulado mediante un modelo en forma de tablero; cada una de sus casillas representa el área de influencia de cada micrófono. El usuario del modelo tiene libertad para determinar el número de micrófonos (dimensiones del tablero), así como el número y posición de las fuentes. Por ejemplo, el modelo equivalente a una sala equipada con 8 micrófonos en la que se hallan 2 fuentes sería el tablero de la siguiente figura: 10 20 30 40 50 60 1 2 3 4 1 2 Figura 1. Modelo de sala con 8 micrófonos y 2 fuentes. El siguiente paso es simular la propagación de las señales emitidas por las fuentes; de este modo, se dispone de las señales captadas por los micrófonos, consistente en mezclas de las formas de onda originales. El objetivo es aprovechar la estructura temporal y espacial de los datos obtenidos para lograr separar y ubicar las fuentes. 1.2. ICA temporal La solución a la versión temporal de ICA se fundamenta en la siguiente expresión: ) ( ) ( t t x W s ⋅ = (3) siendo ] T n t t t x t ) ( ) ( ) ( ) ( 2 1 ) (t x el vector de señales mezcladas, captadas por los n micrófonos en el instante de tiempo t. El resultado de aplicar ICA sobre el vector de señales mezcladas serán las n señales independientes que forman el vector [ ] T n t s t s t s t ) ( ) ( ) ( ) ( 2 1 K = s ; es decir, analizando las señales captadas por n sensores obtenemos n secuencias temporales independientes, obteniendo la deseada separación de fuentes. La siguiente figura ilustra la bidimensionalidad de los datos disponibles (tiempo y espacio), reorganizándolos en forma URSI 2002 1