Descoberta de conhecimento em textos a partir da técnica de clusterização 1 Leandro Krug Wives (Professor UCPEL, Mestrando CPGCC/UFRGS) wives@inf.ufrgs.br Stanley Loh (Professor ULBRA e UCPEL, Doutorando CPGCC/UFRGS) loh@inf.ufrgs.br Resumo Este artigo apresenta uma abordagem para descoberta de conhecimento em textos, utilizando a técnica de clusterização (agrupamento). Ferramentas automatizadas foram criadas para realizar o processo de agrupamento (separação em classes) dos documentos textuais sem intervenção humana. Após o agrupamento dos documentos, ferramentas auxiliares são utilizadas para realizar a descoberta de conhecimento, através da análise das características de cada classe. Como contribuições, além de usar uma nova medida de similaridade para comparar os textos durante o processo de agrupamento, este trabalho discute a aplicação das técnicas e ferramentas de clusterização para realizar a descoberta de conhecimento, juntamente com especialistas humanos, sobre prontuários médicos de uma clínica psiquiátrica. Abstract This work presents an approach to knowledge discovery from text, using a clustering technique. Automated tools perform the clustering process without human intervention. After, other tools support human experts in discovering information through cluster/class analyses. Contributions of this work include a new similarity measure to compare texts and conclusions about experiments using this approach on a base of medical documents in a psychiatric clinic. 1 Este trabalho foi parcialmente financiado por FAPERGS, CAPES e CNPq. Os autores gostariam de agradecer, in memoriam, o Prof. Dr. José M. V. de Castilho