Detección y Seguimiento de Objetos en Entornos Dinámicos mediante Estimación Predictiva del Flujo Óptico J. A. Rodríguez, A. García, C. Urdiales, A. Bandera y F. Sandoval Dpto. Tecnología Electrónica, E.T.S.I. Telecomunicación Universidad de Málaga, Campus de Teatinos, 29071 Málaga E-mail: rodrifer@dte.uma.es Abstract This paper presents an algorithm to segment an image into regions according to their optical flow and to track these regions through a sequence. The method relies on an structural approach that calculates the singular points of the scene through consecutive images. The vector defined by the positions of a same point in two images provides a rough estimation of movement, which is refined by clustering similar vectors into a region and extracting its flow parameters. Tracking is performed by applying Kalman predictors to the centroids of estimated regions. 1. Introducción La detección y seguimiento de movimiento mediante visión artificial ha sido objeto de estudio en multitud de aplicaciones como vigilancia o control de tráfico. En general, se distinguen dos tipos de métodos para llevar a cabo esta operación, según trabajen con la imagen en sí o con modelos estructurales. Mientras que los primeros se basan en relacionar la información disponible en imágenes consecutivas mediante herramientas matemáticas [2][4], los segundos se decantan por modelar los rasgos singulares de una escena para localizarlos en las escenas siguientes [1][5]. Habitualmente, se suelen utilizar los segundos debido a su menor coste computacional, especialmente en escenarios no controlados. En estos casos, dada la potencial complejidad de la escena, tratarán de localizarse puntos, rectas o elipses. Una vez se localizan estos elementos en varias imágenes, el movimiento se estima fácilmente a partir de su desplazamiento. En aplicaciones en tiempo real como el seguimiento de objetos, y para mantener un tiempo de proceso acotado, cada elemento mencionado solo se busca en la vecindad de su posición en imágenes anteriores, pero en escenas complejas los resultados de esta búsqueda suelen ser ambiguos. Algunos métodos como la condensación [2] permiten eliminar esta ambigüedad, pero elevan drásticamente el coste computacional de la aplicación. Este trabajo presenta un sistema de estimación de movimiento y seguimiento que se basa en detectar los puntos de interés de la escena. Para localizar la posición de cada punto en la imagen siguiente, éstos se relacionan por proximidad geométrica y, una vez definida una primera aproximación al movimiento, se agrupan para formar regiones uniformes. Dentro de cada región, el seguimiento se lleva a cabo mediante un predictor lineal tipo Kalman [3], que corrige la inestabilidad intrínseca a la detección de puntos en imágenes reales. 2. Descripción del algoritmo El algoritmo consta de los pasos que se describen a continuación: A. Detección de puntos singulares. La detección de puntos estables en imágenes reales es una tarea complicada que suele resolverse buscando los contornos y esquinas de los objetos presentes en la escena. Aunque algunas técnicas optan por la segmentación en regiones, ésta no siempre asegura buenos resultados debido a la presencia de texturas, sombras y cambios de iluminación. Los métodos estructurales, por otra parte, buscan características de los distintos puntos de la escena independientemente de su pertenencia a una u otra región. En este trabajo se opta por el método USAN [5], que se basa en definir una máscara circular de radio fijo alrededor de cada píxel y estimar la cantidad de píxeles en ese entorno cuyo brillo es similar al centroide. En los bordes de los objetos, esta proporción se reduce considerablemente, alcanzando su mínimo en las esquinas. Dichas esquinas serán los posibles puntos singulares. B. Búsqueda de correspondencias. Una vez se dispone de un conjunto de puntos singulares en dos imágenes consecutivas, éstos se emparejan dos a dos por proximidad geométrica y nivel de brillo. Para compensar la inestabilidad intrínseca al método de detección se aplica un predictor lineal de Kalman [3]. La carga computacional no se ve excesivamente incrementada ya que se usa un modelo de velocidad constante. C. Segmentación por flujo óptico . Cuando el mismo punto se ha localizado en imágenes consecutivas, la diferencia en su posición da una primera aproximación del movimiento de dicho punto. A continuación se agrupan todos aquellos puntos que presentan un vector de