Indexaci´ on y Consultas para Bases de Datos no Convencionales Jorge Arroyuelo, Susana Esquivel, Alejandro Grosso, Ver´ onica Ludue˜ na, Nora Reyes Departamento de Inform´ atica, Universidad Nacional de San Luis {bjarroyu,esquivel,agrosso,vlud,nreyes}@unsl.edu.ar Gonzalo Navarro Departamento de Ciencias de la Computaci ´ on, Universidad de Chile. gnavarro@dcc.uchile.cl Resumen La constante aparici ´ on de datos en forma digital de di- ferentes tipos y tama˜ nos ha dado lugar a la aparici´ on de dep´ ositos no estructurados de informaci ´ on, Bases de Da- tos Multimedia, donde se consultan nuevos tipos de datos (texto libre, im´ agenes, audio, v´ ıdeo, etc.). Esto requie- re un modelo m´ as general tal como las Bases de Datos M´ etricas, que adem´ as alcance un nivel de madurez simi- lar al de las bases de datos tradicionales. Por otro lado, la creciente cantidad de estos datos exige dispositivos de almacenamiento capaces de mantenerlos y de proveer un acceso eficiente a los mismos. Dado que la brecha entre los tiempos de CPU y los de I/O se ha mantenido cre- ciente, se hace necesario considerar memorias con mayor capacidad y m´ as r´ apidas. Este panorama ha promovido la aparici´ on estructuras de datos especializadas que tienen en cuenta estas arquitecturas como las Estructuras de da- tos compactas y las Estructuras de datos con I/O eficien- te. Nuestra investigaci´ on apunta a contribuir a la madurez de estas nuevas bases de datos. Palabras Claves: bases de datos no convencionales, len- guajes de consulta, ´ ındices, expresividad. Contexto Esta l´ ınea de investigaci´ on pertenece al Proyec- to Tecnolog´ ıas Avanzadas de Bases de Datos. En el marco de este proyecto se vienen desarrollando acti- vidades vinculadas al tratamiento de objetos de di- versos tipos, estructurados y no estructurados que son de utilidad en diversos campos de aplicaci´ on, por ejemplo, rob´ otica, visi´ on artificial, computaci´ on gr´ afica, sistemas de informaci ´ on geogr´ afica, compu- taci´ on m´ ovil, dise˜ no asistido por computadora, mo- tores de b´ usqueda en internet, entre otras, y que se relacionan en tales bases de datos. Este proyecto pertenece a la Universidad Nacio- nal de San Luis y se encuentra dentro del Programa de Incentivos a la Investigaci´ on. Las actividades centrales de esta l´ ınea est´ an rela- cionadas con la investigaci´ on de aspectos te´ oricos, emp´ ıricos y aplicativos del problema general de ad- ministrar una base de datos capaz de manipular ti- pos de datos no convencionales. Esto incluye ana- lizar distintos tipos de bases de datos, la expresivi- dad de los lenguajes de consulta, los operadores ne- cesarios para responder consultas de inter´ es, como as´ ı tambi´ en las estructuras y operaciones necesarias para responderlas eficientemente. Adem´ as nuestras investigaciones se encuadran en el marco de un proyecto dentro del Programa de Pro- moci´ on de la Universidad Argentina para el Fortale- cimiento de Redes Interuniversitarias III en los que participa nuestra universidad junto con las universi- dades de: Chile y de La Coru˜ na (Espa˜ na). 1. Introducci´ on y Motivaci´ on La brecha entre los tiempos de CPU y los de I/O se ha mantenido creciente durante las ´ ultimas d´ eca- das. Asimismo han aparecido nuevos niveles en la jerarqu´ ıa de memoria (caches de tama˜ no cada vez m´ as considerable). Por ello, se ha hecho cada vez m´ as atractivo el uso de estructuras de datos que ocu- pen poco espacio, incluso a veces comprimiendo la informaci´ on sobre la que act ´ uan. Si bien trabajar so- bre esta informaci´ on compacta es m´ as laborioso, el hecho de poder mantenerla en una memoria de ´ orde- nes de magnitud m´ as r´ apida la convierte en una al- ternativa muy conveniente a las implementaciones cl´ asicas. Adem´ as, la transferencia de los datos sobre una red local cuesta casi lo mismo que la transfe- rencia a disco, por lo cual ´ esta tambi´ en se ve favore- cida con la compresi´ on. Este escenario ha originado l´ ıneas de investigaci´ on que consideran estas diferen- cias de costos de operaciones, y dise˜ nan estructuras 231 WICC 2010 - XII Workshop de Investigadores en Ciencias de la Computación