Criação automática de uma base de citações para o SciELO a partir dos seus arquivos XML Informação & Tecnologia (ITEC): Marília/João Pessoa, 1(1): 42-67, jan./jun., 2014 42 Criação automática de uma base de citações para o SciELO a partir dos seus arquivos XML Max Cirino de Mattos Universidade Federal de Minas Gerais (UFMG), Brasil. E-mail: max@cognotec.com.br Beatriz Valadares Cendón Universidade Federal de Minas Gerais (UFMG), Brasil. E-mail: bcendon@gmail.com Resumo O artigo demonstra o uso arquivos eXtensible Markup Language (XML) da Scientific Electronic Library Online (SciELO) para criação de um protótipo para a criação de bases de citações das suas revistas. O foco principal do artigo é a descrição da metodologia usada para a obtenção automática dos dados estatísticos de cada Coleção do SciELO, bem como dos arquivos XML disponíveis para cada periódico. Esses arquivos foram interpretados e os metadados dos artigos e das referências usadas na sua produção foram gravados automaticamente em uma base de citações. A Coleção Saúde Pública foi usada para exemplificar a aplicação do protótipo. Sugere-se a disponibilização da base de citações, com atualização automática, de forma integrada ao site de cada uma das revistas listadas. Palavras-chave: Ciência da Informação. SciELO. Base de Citações. XML. 1 Introdução De acordo com Cendón, Guimarães, Silva, Oliveira, Mattos, Santana e Fernandes (2012, p.2), “a produção de indicadores que possam medir e avaliar a produção científica brasileira passa necessariamente pela existência de um índice de citações, nos moldes daqueles produzidos pelo Institute of Scientific Information (ISI)”. Os autores afirmam que tais indicadores “podem ser balizadores de políticas científicas nacionais, entre várias outras aplicações”. Guimarães, Silva, Santana, Braga, Bochner e Goldbaum (2011, p. 5) explicam que a deficiência da cobertura dos índices existentes (a exemplo dos produzidos pelo ISI) pode ocasionar deformações “nos processos de gestão das atividades científicas em contexto local”. Conforme os autores, essas deformações podem levar diversos países a buscar o desenvolvimento de índices de citações locais, a exemplo da China (XIN-NING, 2001), Polônia (WEBSTER, 1998) e União Europeia (GOGOLIN et al., 2003). A carência de bases de dados em informação científica nos moldes do Science Citation Index (SCI) também é ressaltada por Meneghini (1998) em sua análise da produção científica nacional. Visando suprir essa carência, a pesquisa desenvolvida na Escola de Ciência da Informação da UFMG buscou identificar a viabilidade da criação de bases de citações considerando como fonte primária a Scientific Electronic Library On-Line (SciELO) a partir da obtenção automática dos metadados dos artigos e referências citadas disponíveis no formato eXtensible Markup Language (XML). Este artigo relata a metodologia desenvolvida para obtenção dos dados e para a interpretação dos mesmos, e discute possíveis aplicações, usando como exemplo a Coleção Saúde Pública do SciELO.