AtoZ Novas práticas em informação e conhecimento ARTIGO | RESEARCH PAPER ISSN: 2237-826X 3(2), jul./dez. 2014 87 Análise de tendências da produção cientíica nacional na área de Ciência da Informação: estudo exploratório de mineração de textos Trend analysis of the Brazilian scientiic production in information science area: exploratory study of text mining Caio Cesar Trucolo 1 , Luciano Antonio Digiampietri 1 Copyright © 2014 Trucolo & Digiampietri. Todo o conteúdo da Revista está sob uma licença Creative Commons Atribuição-NãoComercial-CompartilhaIgual 3.0 Não Adaptada. Ao serem publicados por esta Revista, os artigos são de livre uso em ambientes educacionais, de pesquisa e não comerciais, com atribuição de autoria obrigatória. Mais informações em http://www.atoz.ufpr.br/index.php/atoz/about/submissions#copyrightNotice. 1 Universidade de São Paulo (USP), São Paulo, SP, Brasil Autor para correspondência/Corresponding author: Caio Cesar Trucolo [ trucolo@gmail.com ] Financiamento/Funding: O trabalho apresentado neste artigo foi parcialmente inanciado pela CAPES (bolsa de mestrado) e pelo CNPq (Pro- jeto Universal e bolsa de produtividade em pesquisa). Recebido/Submitted: 17 Out. 2014 Aceito/Approved: 15 Nov. 2014 Introdução: A análise de tendências pode ser utilizada como uma estratégia para identiicar assuntos ou áreas de pesquisa com potencial de popularidade mas que ainda não são muito disseminados. Este trabalho consiste em identiicar tendências por mineração de texto e análise histórica das produções cientíicas (artigos cientíicos) de doutores da área de Ciência da Informação. Método: De natureza exploratória, este trabalho foi construído em três etapas. A primeira etapa foi a da obtenção dos dados dos currículos cadastrados na plataforma Lattes. A segunda etapa consistiu na extração automática dos termos mais importantes inseridos nos títulos das publicações e, na terceira etapa, foram feitas regressões lineares e não lineares dos índices de importância baseados em frequência dos termos extraídos. Resultados: Informações gerais sobre as tendências identiicadas para a área de Ciência de Informação para curto, médio e longo prazo são apresentadas. Conclusão: Este trabalho apresenta e aplica uma metodologia de identiicação de tendências que ainda pode ser considerada um primeiro passo ante ao potencial da análise de tendências para a produção cientíica nacional. Além disso, informações gerais sobre as tendências identiicadas e os comportamentos dessas tendências ao longo do tempo foram discutidas. Palavras-chave: Análise de tendências. Ciência da informação. Redes sociais. Introduction: Trend analysis can be used as a strategy to identify subjects or research areas with potential of popularity which are not very widespread. This work consists of trend identiication by text mining and historic analysis of the scientiic productions (scientiic papers) of the Information Science area PhDs. Method: This work, having an exploratory basis, was built in three steps. The irst step was the data gathering of the curricula registered in Lattes plat- form. The second one consisted of automatic extraction of the most important terms inside the publications titles and, in the third step, linear and non linear regression of the frequency based importance index of the extracted terms were executed. Results: Identiied trends from the Information Science area for short, medium and long time were presented. Conclusion: This work presents and applies a trend identiication method that can be seen as a irst step considering all the potential of the national scientiic production trend analysis. Moreover, trend analysis general information and the trends behavior over time were discussed. Keywords: Trend analysis. Information science. Social networks. Resumo Abstract Estratégias e políticas públicas têm sido inseridas no país para melhorar a qualidade e aumentar a produti- vidade da pesquisa cientíica. Muitas vezes essas políticas são escolhidas de acordo com áreas de pesquisa já consolidadas e populares, nas quais se sabe que haverá retorno, ou ainda, identiicadas como tendências mundiais. Um país com dimensões continentais como o Brasil – tanto em extensão geográica quanto em di- versidade cultural – poderia investir em áreas e temas com potencial de crescimento, ampliando o potencial de retorno da investigação cientíica. A produção cientíica no Brasil vem crescendo exponencialmente nas últimas décadas (Digiampietri et al., 2012a) o que só faz crescer o interesse em entender as características da pesquisa no País. Tal análise pode beneiciar da utilização da mineração de texto em tais produções com o objetivo de tentar identiicar áreas e temas de pesquisa nas quais os pesquisadores de determinada área trabalham (Miyata, Kano, & Digiampietri, 2013). Assim, analisar tendências a partir das produções cientíicas para áreas especíicas se conigura como uma estratégia para encontrar temas de pesquisa com potencial de impacto (Trucolo & Digiampietri, 2014b). INTRODUÇÃO http://www.atoz.ufpr.br/index.php/atoz/article/view/79