77 Proceedings of the 8th Brazilian Symposium in Information and Human Language Technology, pages 77–86, Cuiab´a, MT, Brazil, October 24–26, 2011. c 2011 Sociedade Brasileira de Computa¸c˜ao An´ alise autom ´ atica de aspectos relacionados ` a coerˆ encia semˆ antica em resumos acadˆ emicos Vin´ ıcius Mour ˜ ao Alves de Souza 1 , Val´ eria Delisandra Feltrim 1 1 Departamento de Inform´ atica – Universidade Estadual de Maring´ a (UEM) Av. Colombo, 5.790 – 87020-900 – Maring´ a – PR – Brazil {vsouza, valeria.feltrim}@din.uem.br Abstract. In this paper we present classifiers responsible for automate the anal- ysis of semantic coherence aspects in academic abstracts. These aspects are based on the schematic structure of the Abstract section and on the semantic similarity among different components that compose the structure. The clas- sifiers were trained and induced by machine learning algorithms based on fea- tures automatically extracted from the surface of the text and from the processing of the LSA. Results indicate that all classifiers achieved superior performance compared to baseline measures. Thus, they can be used in environments of aid to writing for emission of suggestions related to coherence. Resumo. Neste artigo s˜ ao propostos classificadores respons´ aveis por automa- tizar a an´ alise de aspectos relacionados ` a coerˆ encia semˆ antica em resumos acadˆ emicos. Tais aspectos s˜ ao baseados na estrutura esquem´ atica da sec ¸˜ ao Resumo e na similaridade semˆ antica entre os componentes que comp˜ oem tal estrutura. Os classificadores foram treinados e induzidos por algoritmos de aprendizado de m´ aquina, com base em caracter´ ısticas extra´ ıdas automatica- mente da superf´ ıcie do texto e provenientes do processamento da LSA. Os resul- tados indicam que todos os classificadores alcanc ¸aram desempenho superior ` as medidas de comparac ¸˜ ao e que podem ser utilizados, por exemplo, em ambientes de aux´ ılio ` a escrita para emiss˜ ao de sugest˜ oes relacionadas ` a coerˆ encia. 1. Introduc ¸˜ ao O resumo pode ser considerado uma das sec ¸˜ oes mais importantes de um tra- balho acadˆ emico, dado que, em conjunto com o t´ ıtulo, ´ e utilizado pela comu- nidade cient´ ıfica como primeiro meio de divulgac ¸˜ ao de suas pesquisas. Assim como os trabalhos acadˆ emicos possuem uma estrutura bem definida, em geral enun- ciada como Introduc ¸˜ ao – Desenvolvimento – Conclus˜ ao, a sec ¸˜ ao destinada ao re- sumo tamb´ em possui um esquema estrutural bem definido e pass´ ıvel de ser mo- delado. V´ arios modelos estruturais para resumos tˆ em sido descritos na liter- atura [Swales 1990][Weissberg e Buker 1990][Alu´ ısio e Oliveira Jr 1996]. Feltrim et al. (2003) propuseram um modelo estrutural espec´ ıfico para resumos de dissertac ¸˜ oes e teses em Ciˆ encia da Computac ¸˜ ao composto por seis componentes esquem´ aticos dispostos na seguinte ordem: Contexto, Lacuna, Prop´ osito, Metodologia, Resultado e Conclus˜ ao. A partir desse modelo estrutural e da an´ alise de diferentes aspectos de coerˆ encia entre os componentes esquem´ aticos realizada por Souza e Feltrim (2011), este trabalho