1 https://revistas.ufrj.br/index.php/aigeo/ ISSN 0101-9759 Anuário do Instituto de Geociências Universidade Federal do Rio de Janeiro e-ISSN 1982-3908 Anuário do Instituto de Geociências, 2021, v. 44, 37979 DOI: https://doi.org/10.11137/1982-3908_2021_44_37979 Desempenho do Algoritmo de Classifcação de Imagens Random Forest para Mapeamento do Uso e Cobertura do Solo no Cerrado Brasileiro Performance of the Random Forest Image Classifer for Mapping Land Use and Land Cover in the Brazilian Cerrado David Fernando Cho 1,3 , Samuel Fernando Schwaida 2,3 , Rejane Ennes Cicerelli 3 , Tati Almeida 3 , Ana Paula Marques Ramos 4 & Edson Eyji Sano 3,5 1 Instituto Brasileiro do Meio Ambiente e dos Recursos Naturais, SCEN Ibama, Brasília, DF, Brasil 2 Ministério do Meio Ambiente, Esplanada dos Ministérios, Brasília, DF, Brasil 3 Universidade de Brasília, Insti tuto de Geociências, Campus Universitário Darcy Ribeiro, Brasília, DF, Brasil 4 Universidade do Oeste Paulista – UNOESTE, Pós-Graduação em Meio Ambiente e Desenvolvimento Regional, Presidente Prudente, SP, Brasil 5 Embrapa Cerrados, Planaltina, DF, Brasil E-mails: samuelschwaida@gmail.com; davidfcho@gmail.com; rejaneig@unb.br; tati_almeida@unb.br; anaramos@unoeste.br; edson.sano@ibama.gov.br Abstract The Cerrado is a highly diversifed ecosystem and provides habitat for many species, however, it has undergoing marked degradation in recent decades due to the expansion of agricultural commodity production. This scenario reinforces the need for continuous monitoring of land use and land cover (LULC) changes, whether with a focus on environmentally sustainable agricultural production or market understanding. Recently, machine learning algorithms have become a promising and innovative approach to remote sensing data processing. Thus, this study aimed to evaluate the potential of the Random Forest image classifcation algorithm for LULC mapping and classifcation in the Brazilian Cerrado. The selected study area was the municipalities of Natividade, Chapada da Natividade, and São Valério da Natividade, located in the state of Tocantins. The basic materials of this study were the digital elevation model produced by the Shuttle Radar Topography Mission (SRTM), the night light images obtained by the Visible Infrared Imaging Radiometer Suite (VIIRS) sensor onboard the Suomi National Polar-Orbiting Partnership (Suomi NPP) and NOAA-20 satellites, and the Landsat 8 Operational Land Imager satellite (OLI) multispectral images acquired from May to October 2013. All analyzes were performed on the Google Earth Engine platform that allows cloud computing. A cube of images was generated containing 38 layers that were classifed by the Random Forest algorithm, with 500 decision trees. For the algorithm training, random points from each LULC class mapped by the TerraClass Cerrado 2013 project were used. Considering the TerraClass Cerrado 2013 mapping as the ground truth, a Kappa index of 0.64 was obtained. There was a signifcant overestimation of annual cropland and urban areas. The proposed methodology presented a good potential for less expensive and less time demanding LULC mapping of the Cerrado. Keywords: Geotechnologies; Machine learning; Cloud processing Resumo O Cerrado é um ecossistema altamente diversifcado e fornece habitat para muitas espécies, porém, vem sofrendo degradação acentuada nas últimas décadas devido à expansão da produção de commodities agrícolas. Esse cenário reforça a necessidade de contínuo monitoramento das mudanças de uso e cobertura do solo, seja com foco na produção agrícola ambientalmente sustentável ou no entendimento do mercado. Recentemente, os algoritmos de aprendizagem de máquina têm-se concretizado como uma abordagem promissora e inovadora para processamento de dados de sensoriamento remoto. Assim, esse trabalho teve por objetivo avaliar o potencial do algoritmo de classifcação de imagens Random Forest para o mapeamento e classifcação do uso e cobertura do solo no Cerrado Brasileiro. A área de estudo selecionada foram os municípios de Natividade, Chapada da Natividade e São Valério da Natividade, localizados no estado do Tocantins. Os materiais básicos deste estudo foram o modelo digital de elevação produzido pela missão Shuttle Radar Topography Mission (SRTM), as imagens de luzes noturnas obtidas pelo sensor Visible Infrared Imaging Radiometer Suite (VIIRS) dos satélites Suomi National Polar-Orbiting Partnership (Suomi NPP) e NOAA-20 e as imagens multiespectrais do satélite Landsat 8 Operational Land Imager (OLI), adquiridas entre os meses de maio a outubro de 2013. Todas as análises foram realizadas na plataforma Google Earth Engine que permite processamento de dados em nuvem. Foi gerado um cubo de imagens contendo 38