EATIS 2007 As Bibliotecas Digitais e os Motores de Busca: novos Sistemas de Informação no contexto da Preservação Digital Ricardo Campos * * Instituto Politécnico de Tomar Centre for Human Language Technology and Bioinformatics, Universidade da Beira Interior ricardo.campos@ipt.pt; ricardo @hultig.di.ubi.pt Abstract Os primeiros projectos de desenvolvimento de bibliotecas digitais surgem há alguns anos com a digitalização, mas só em 1996, com o início da expansão da Internet, surgem as primeiras iniciativas de web archiving. Neste processo de progressivo crescimento e utilização, a Internet surge como uma nova oportunidade indutora da revitalização do tradicional serviço bibliotecário e os motores de busca afiguram-se como o elemento central de suporte ao novo paradigma da criação do conhecimento, ao capturar, armazenar e disponibilizar acesso aos recursos, reservando-nos uma biblioteca digital em cada computador com acesso à Internet. Este artigo, tem por objectivo analisar as duas vertentes de desenvolvimento de bibliotecas digitais, digitalização e web archiving, apresentar as potencialidades e limitações associadas ao desenvolvimento de uma biblioteca digital, sumarizar projectos e iniciativas relevantes e contextualizar o papel dos motores de busca na disponibilização, difusão e consequente preservação digital da informação. Abstract The first’s library projects occur some years ago with digitization, but just in 1996, the first’s web archive initiatives start occurring. Such, was based in the Internet growth and in its increasing use, items that revealed to be an opportunity to transform and readapt the traditional library services. In this context, search engines play a fundamental role of support to the new paradigm of knowledge, by capturing, storing and providing access to the resources, allowing the existence of a digital library in each computer with internet access. In this article we analyze the ways of developing a digital library, taking higher attention to the web harvesting technique, and presenting digital libraries capabilities and limitations. Then we fully summarize relevant projects and initiatives, to finally study the role of search engines in what concerns to, digital preservation, access and information diffusion. Keywords: Digital Libraries; Digital Preservation; Web Archiving; Web Harvesting; Search Engines; Information Systems. 1. Introdução Com a difusão das TIC (Tecnologias de Informação e Comunicação) rapidamente os sistemas de informação ganharam espaço dentro das organizações empresariais. Basicamente um sistema de informação é uma aplicação que captura dados dos sistemas operacionais, armazena informação e difunde conhecimento. Como alternativa à captura de dados nos sistemas operacionais, os sistemas de informação empresariais, baseados no conceito de web farming, exploram os imensos recursos publicados na Internet. A criação de uma biblioteca digital assume implicitamente a estrutura de um típico sistema de informação empresarial: captura, armazena, disponibiliza informação e tal como nos sistemas de informação empresariais, utiliza a Internet como um óbvio recurso de exploração, baseado no conceito de web archiving. Os sistemas de informação baseados na web, os web archiving aparecem assim como uma alternativa e uma evolução normal no contexto da utilização das tecnologias por parte das bibliotecas que inicialmente as utilizavam para a simples digitalização de recursos físicos. De acordo com [12], a digitalização e a preservação digital são actividades de crescimento considerável nos próximos anos, e os conteúdos digitais de alta qualidade, factores chave para actividades industriais de grande escala, nomeadamente o interesse por parte de motores de busca. Baseado em princípios similares de funcionamento (os motores de busca utilizam o conceito de indexação e catalogação de palavras pertencentes a um site, um processo similar a um vulgar índice remissivo), as bibliotecas tem assim uma enorme vantagem em disponibilizar acesso às suas colecções através da Internet e uma responsabilidade em capturar, armazenar e disponibilizar os seus conteúdos recorrendo a motores de busca. No capítulo seguinte definimos o conceito de biblioteca digital, com maior enfoque na vertente de web archiving, resumimos projectos, parcerias, iniciativas e apresentamos as potencialidades e limitações associadas ao desenvolvimento de uma biblioteca digital. No