Um estudo comparativo de classificadores na previsão da evasão de alunos em EAD Jorge L. C. Ramos 1 , João C. Sedraz Silva 1 , Leonardo C. Prado 1 Alex S. Gomes 2 , Rodrigo L. Rodrigues 3 1 Universidade Federal do Vale do São Francisco - Juazeiro - BA Brasil 2 Universidade Federal de Pernambuco - Recife-PE, Brasil 3 Universidade Federal Rural de Pernambuco - Recife-PE, Brasil. Abstract. The use of machine learning and data mining algorithms in educational contexts has evolved due to the large availability of data generated mainly in virtual learning environments. This study makes a comparative analysis of five classifiers in the task of predicting students with risk of dropping out in undergraduate courses by distance education. The results showed a small advantage for the use of Logistic Regression in the data analyzed, with success rates above 90% in the predictive model. Resumo. O uso de algoritmos de mineração de dados e de aprendizagem de máquina em contextos educacionais tem evoluído em razão da grande disponibilidade de dados geradas principalmente em ambientes virtuais de aprendizagem. Este estudo faz uma análise comparativa de cinco classificadores na tarefa de predição de alunos com risco de evasão em cursos de graduação por EAD. Os resultados apontaram uma pequena vantagem para o uso da Regressão Logística nos dados analisados, com taxas de sucesso acima de 90% no modelo preditivo. 1. Introdução A Educação a Distância (EAD) vem crescendo de maneira acentuada nos últimos anos e assumido um importante papel no cenário educacional. Essa modalidade viabiliza, dentre outras oportunidades, a formação em horário flexível distinto dos ambientes escolares presenciais, além de possuir um alcance geográfico abrangente, que permite a inclusão cada vez maior de pessoas na educação profissional e superior. Os dados do crescimento da EAD no Brasil, fornecidos pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP) 1 , apontam um crescimento significativo da modalidade no país nos últimos anos. O INEP é um órgão federal vinculado ao Ministério da Educação (MEC) com o objetivo de promover estudos, pesquisas e avaliações sobre o Sistema Educacional Brasileiro. Segundo esses dados, o número de alunos na modalidade graduação a distância continua crescendo, atingindo 1,34 milhão em 2014, o que já representa uma participação de 17,1% do total de matrículas da educação superior. Enquanto o número de matrículas em cursos de graduação presenciais cresceu 5,4% entre 2013 e 2014, na modalidade a distância, o aumento foi de 16,3%. Aliadas ao incremento da modalidade, as pesquisas na área também devem buscar atenuar ou resolver problemas que surgem decorrentes dessa expansão, como, por exemplo, os altos índices de evasão ainda verificados na modalidade. Para a maioria das instituições brasileiras que participam do Censo Anual da EAD no Brasil, o maior obstáculo enfrentado tem sido a evasão nos cursos, onde para 32% das instituições pesquisadas, a taxa média de evasão 1 http://portal.inep.gov.br/ DOI: 10.5753/cbie.sbie.2018.1463 1463 Anais do XXIX Simpósio Brasileiro de Informática na Educação (SBIE 2018) VII Congresso Brasileiro de Informática na Educação (CBIE 2018)