Manteniendo el Foco: Control de Seguimiento y Vergencia en un Sistema de Atenci´ on Visual Pilar Bachiller y Pablo Bustos Resumen—Durante los ´ ultimos a ˜ nos, la atenci´ on visual se ha convertido en una cuesti´ on de gran inter´ es en visi´ on artiﬁcial. La mayor´ ıa de los modelos existentes plantean el mecanismo atencional como un medio de exploraci´ on visual y detecci´ on de objetos que se resuelve de forma est´ atica, sin movimientos de c´ amara. En situaciones reales, la atenci´ on debe ir acompa ˜ nada de mecanismos de ﬁjaci´ on que permitan mantener el foco de atenci´ on aunque se produzcan variaciones provocadas por la din´ amica del entorno o por las propias acciones del robot. Para tratar esta cuesti´ on, en este art´ ıculo se presenta un sistema de seguimiento 3D de objetivos visuales que se encuentra integrado en un sistema de atenci´ on visual. Como principal aportaci´ on, se propone la descomposici´ on de la ﬁjaci´ on 3D en dos movimientos que forman dos subsistemas: controlador de seguimiento monoc- ular y controlador de vergencia. Para validar esta propuesta, se muestran los resultados obtenidos en una serie de experimentos reales realizados en un robot m´ ovil dotado de una torreta de visi´ on est´ ereo. Palabras clave—Seguimiento 3D, atenci´ on visual, visi´ on activa. I. I NTRODUCCI ´ ON L OS movimientos oculares son esenciales en muchos sis- temas visuales de seres vivos porque permiten compensar la p´ erdida de resoluci´ on debida al peque˜ no tama˜ no de la f´ ovea. Mediante dichos movimientos es posible dirigir la f´ ovea hacia nuevos objetos de inter´ es o compensar los movimientos de un objeto que esta siendo focalizado [4]. Como en sus hom´ ologos biol´ ogicos, los sistemas visuales de los robots con campo visual limitado deben incorporar capacidades motoras que permitan adaptar sus sensores de forma efectiva a su relaci´ on con un entorno din´ amico. En este art´ ıculo se presenta un sistema de control de seguimiento 3D de objetivos visuales. El sistema est´ a integrado en una red de componentes que constituyen un modelo de atenci´ on visual para un robot m´ ovil con visi´ on estereosc´ opica [3]. Dentro de este modelo, la atenci´ on es dirigida hacia regiones de inter´ es del entorno siguiendo una estrategia de control guiada por objetivo. Las regiones son extraidas en fases iniciales del proceso a partir de la detecci´ on de puntos de inter´ es en el espacio de escala mediante el m´ etodo Harris- Laplace [9]. La selecci´ on de una regi´ on como foco de atenci´ on se transforma en una respuesta motora que proporciona la ﬁjaci´ on y el seguimiento binocular del nuevo foco hasta la se- lecci´ on del siguiente. Los componentes de control dedicados a esta ´ ultima etapa de proceso forman el sistema de seguimiento 3D propuesto. Pilar Bachiller y Pablo Bustos est´ an en la Universidad de Extremadura E-mail: pilarb@unex.es Existen numerosas propuestas de control de seguimiento vi- sual [10]. Dentro de los trabajos de seguimiento con m´ ultiples vistas, el planteamiento mayoritario consiste en realizar un control de seguimiento homog´ eneo en las distintas c´ amaras basado en la b ´ usqueda de correspondencias entre las diferentes vistas [5] [8]. La propuesta que aqu´ ı se presenta constituye un esquema de control cooperativo en el que cada c´ amara juega un papel diferente en el control global. As´ ı, el sistema est´ a formado por dos subsistemas de control: un subsistema de control monocular de seguimiento y un subsistema de control asim´ etrico de vergencia. Esta separaci´ on permite que el sac´ adico que proporciona la ﬁjaci´ on inicial sobre el objetivo pueda programarse para una ´ unica c´ amara a la vez que se mantiene un focalizaci´ on estable en ambas c´ amaras [6]. Adem´ as, este esquema proporciona una respuesta eﬁcaz ante situaciones en las que no es posible obtener una corresponden- cia completa del objetivo en el par de im´ agenes por el cambio de perspectiva, la ocultaci´ on parcial en una de las vistas o incluso por la no visibilidad del objetivo desde una de las c´ amaras. II. CONTROL DE SEGUIMIENTO VISUAL El seguimiento de un objetivo visual requiere un proceso de b´ usqueda de correspondencias entre la regi´ on objetivo y la imagen obtenida de la captura actual. Puesto que las regiones son elementos distintivos de una imagen, su localizaci´ on puede resolverse de manera adecuada mediante m´ etodos basados en correlaci´ on. Como en un problema cl´ asico de correspondencias entre caracter´ ısticas de imagen, el mantenimiento del foco de atenci´ on consistir´ a en la localizaci´ on de la ventana de la nueva imagen que maximiza el coeﬁciente de correlaci´ on sobre la regi´ on objetivo. Ahora bien, si el ´ unico criterio es la similitud entre ventanas de imagen, en muchos casos pueden aparecer falsos positivos que hay que descartar. Si existen varios m´ aximos de valores pr´ oximos, es necesario utilizar alg´ un criterio adicional que permita obtener una ´ unica regi´ on de m´ axima similitud con el objetivo [7]. Cuando el contenido de una regi´ on no es lo suﬁcientemente discriminatorio, la informaci´ on sobre su entorno pr´ oximo puede ayudar a obtener una ´ unica zona de imagen coherente con la regi´ on objetivo. El an´ alisis del entorno de una regi´ on puede llevarse a cabo aumentando el tama˜ no de la ventana de correlaci´ on y realizando as´ ı una comparaci´ on con zonas mayores del campo visual. Haciendo uso de una representaci ´ on multi-resoluci´ on de la imagen [1], este proceso es similar a una comparaci´ on en niveles de menor resoluci´ on manteniendo el tama˜ no de la ventana de correlaci´ on. Con esta idea, el m´ etodo