Uso de t-Spanners para B´ usqueda en Espacios M´ etricos ⋆ Rodrigo Paredes Centro de Investigaci´on de la Web, Departamento de Ciencias de la Computaci´on, Universidad de Chile. Blanco Encalada 2120, Santiago, Chile. raparede@dcc.uchile.cl Profesor Gu´ ıa: Gonzalo Navarro. gnavarro@dcc.uchile.cl Resumen El problema de B´ usqueda en Espacios M´ etricos o B´ usqueda Aproximada consiste en encontrar los elementos de un conjunto m´as cercanos a una consulta dada bajo alg´ un criterio de similitud. Este problema tiene aplicaciones en muchas ´areas de las ciencias de la computaci´on, por ejemplo: bases dedatos multimediales, clasificaci´onautom´atica,cuantizaci´onycompresi´onde im´agenes, recuperaci´on detexto, biolog´ ıa computacional y predicci´on de funciones. Por otro lado, en teor´ ıa de grafos se tiene el concepto de t-spanner, que consiste en un subgrafo G ′ de un grafo G tal que aproxima las distancias en G con un factor de precisi´on t. En este trabajo se propone una nueva metodolog´ ıa para resolver el problema de b´ usqueda en espacios m´ etricos, la cual considera un t-spanner G ′ (V,E) como la representaci´on de la base de datos m´ etrica. En G ′ , el conjunto de v´ ertices V corresponde a los objetos del espacio m´ etrico y el conjunto de aristas E corresponde a una selecci´on reducida de las distancias entre pares de objetos. Para cumplir este objetivo se proponen varios algoritmos de construcci´on de t-spanners, de inserci´on y borrado deobjetos, de reconstrucci´on de t-spanners, y de recuperaci´on de objetos. Se eval´ uan experimentalmente todos los algoritmos propuestos. Por ´ ultimo, se conjetura que la propiedad del espacio m´ etrico que resulta esencial para el buen desempe˜ no de los t-spanners es la existencia de clusters de elementos, y se entrega suficiente evidencia emp´ ırica que avala este resultado. Esta propiedad se presenta en la mayor´ ıa de los espacios m´ etricos construidos con objetos del mundo real, por lo que se espera que los t-spanners se comporten bien en la pr´actica. Adem´as, se muestra que los t-spanners tienen un gran potencial de aplicaciones y mejoras en el ´ambito de los espacios m´ etricos. Abstract The problem of Searching in Metric Space or Proximity Searching consists on finding the elements of a set which are closest to a given query under some similarity criterion. This problem has applications in several computer science branches, for example: multimedia databases, machine classification, image quantization and compression, text retrieval, computational biology and function prediction. On the other hand, in graph theory it is defined the concept of t- spanner as a subgraph G ′ of a graph G that approximates the distances on G with a precision factor t. A new methodology to solve the metric spaces search problem is presented in this work, which considers a t- spanner G ′ (V,E) as the metric database representation. In G ′ , the vertices set V corresponds to the metric space objects, and the edges set E corresponds to a reduced selection of the distances between object pairs. To achieve this goal several t-spanner construction, object insertion and deletion, t-spanner reconstruction, and object retrieval algorithms are proposed. All these algorithms are experimentally evaluated. Finally, it is conjectured that the essential metric space property for a good t-spanner performance is the existence of element clusters, and enough empirical evidence is given to support this result. This property holds in most real-world metric spaces, so it is expected that t-spanners will have a good behavior in practice. Futhermore, it is shown that t-spanners have a great potential of applications and improvements in the field of metric spaces. ⋆ Este trabajo ha sido financiado en parte por el N´ ucleo Milenio Centro de Investigaci´on de la Web, Proyecto P01-029-F, Mideplan, Chile; Proyecto CYTED VII.19 RIBIDI y Proyecto MECESUP UCH0109.