EDUCAÇÃO CIÊNCIA E SAÚDE, v.2, n.1, Janeiro a Junho de 2015 ISSN 2358-7504 http:// periodicos.ces.ufcg.edu.br 68 DBFIRE: USING DATABASE QUERIES FOR INFORMATION RETRIEVAL Vladimir Soares Catão 1 , Marcus Costa Sampaio 2 , Ulrich Schiel 3 1 Education Academic Unit, Federal University of Campina Grande, Cuité-PB, Brazil. 2,3 Systems and Computing Unit, Federal University of Campina Grande, Campina Grande-PB, Brazil. Email: vladimirsc@ufcg.edu.br Resumo Bancos de dados e documentos são tipicamente controlados por sistemas diferentes, que normalmente não se comunicam entre si: Sistemas Gerenciadores de Bancos de Dados (SGBD) e Sistemas de Recuperação de Informação (SRI), respectivamente. No entanto, é bastante provável que tais sistemas armazenem dados sobre as mesmas entidades, o que constitui um forte apelo para sua integração. Neste artigo, apresentamos uma abordagem para a integração SGBD/SRI, a qual se utiliza dos termos mais bem colocados encontrados numa consulta ao SGBD como sementes de uma busca a documentos no SRI. Estes termos “expandem” um conjunto base de palavras-chave providas pelo usuário, e são ordenados a partir de uma medida de sua difusão ao longo do resultado da consulta ao SGBD. Os experimentos mostram que a abordagem apresenta resultados significativos quando comparada a outros trabalhos. Palavras-chave: integração da informação, integração SGBD/SRI, expansão de buscas, métodos de ordenação de termos. Abstract Databases and documents are normally controlled by different systems, which usually do not communicate with each other: Database Management Systems (DBMS) and Information Retrieval Systems (IRS), respectively. Still, it is very likely that they store information about the same entities, which is a strong appeal for their integration. In this paper, we present an approach for DBMS/IRS integration that uses top-ranked terms in a DBMS query as keywords for an IRS search, in order to retrieve documents somehow related to the query. These terms “expand” an initial keyword set provided by the user, and are ranked according to a measure of their diffusion over the database query result. Experiments show that the approach presents significant improvements compared to other integration methods. Keywords: Information integration, DBMS/IRS integration, query expansion, term ranking methods. 1 Introduction Databases and documents are the main information storage in most organizations. Examples of structured data, databases follow strict data