Redes LSTM e Modelos de Box-Jenkins Aplicados à Previsão de Carga de um Grande Consumidor de Energia Elétrica do Sudeste Brasileiro Aline Nunes 1 , Letícia da Conceição 1 , Leonardo Forero 1 , Harold de Mello Jr. 1 , Allan Gurwicz 2 , Karla Figueiredo 3 1 Departamento de Engenharia Elétrica Universidade do Estado do Rio de Janeiro (UERJ), Rio de Janeiro, Brasil alinenunes.uerj@gmail.com, {leticiasimoes17, leofome}@hotmail.com, harold.dias@gmail.com 2 Departamento de Engenharia Elétrica Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio), Rio de Janeiro, Brasil agurwicz@ele.puc-rio.br 3 Departamento de Informática e Ciência da Computação Universidade do Estado do Rio de Janeiro (UERJ), Rio de Janeiro, Brasil karla.figueiredo@gmail.com I. INTRODUÇÃO Em um contexto atual de maior flexibilidade na forma com que os contratos de energia são firmados, é importante utilizar ferramentas que possam auxiliar em uma contratação mais próxima da demanda real de energia, reduzindo custos decorrentes de uma contratação abaixo ou acima da necessidade do cliente. O principal objetivo deste trabalho é realizar um estudo comparativo de desempenho entre métodos estatísticos e modelos baseados em inteligência computacional na previsão de carga single-step de um grande consumidor do setor educacional da região sudeste do Brasil. Para isto, foram utilizadas como base de dados as séries temporais de demanda máxima mensal nos períodos de ponta e fora de ponta, entre os anos de 2002 e 2015, e aplicados dois métodos diferentes para previsão de demanda: modelos de Box & Jenkins [1] e Redes Neurais Artificiais do tipo LSTM [2]. II. MÉTODO Para ambos os períodos, de ponta e fora de ponta, o modelo encontrado pela função autoarima (do pacote Forecast da linguagem R [3]) foi um modelo autorregressivo integrado de médias móveis com sazonalidade ARIMA(2,0,0)(2,1,0). A topologia utilizada para a rede foi um modelo sequencial composto de uma camada LSTM de entrada e uma outra camada Dense de saída. O otimizador utilizado foi o Adaptive Moment Estimation (Adam) e os demais parâmetros, tais como janelamento, batchsize, número de épocas e número de unidades de memória da camada LSTM foram variados em diversos experimentos. Os resultados mais satisfatórios tiveram configuração de janelamento igual a 11, 128 unidades de memória da camada LSTM, batchsize de 64 e 30 épocas. III. RESULTADOS E CONCLUSÕES Os dados foram separados em treinamento/validação (janeiro de 2002 a dezembro de 2014) e teste (janeiro de 2014 a dezembro de 2015). TABELA I ERROS DE TREINAMENTO E TESTE PARA DEMANDA MÁXIMA PONTA FORA DA PONTA Treinamento (2002 a 2013) Teste (2014/2015) Treinamento (2002 a 2013) Teste (2014/2015) Modelos RMSE (kW) MAPE(%) RMSE (kW) MAPE (%) RMSE (kW) MAPE(%) RMSE (kW) MAPE (%) ARIMA 299,40 8,41 290,09 10,32 312,67 7,91 433,08 13,18 LSTM 78,23 2,14 235,93 6,97 98,11 2,57 266,70 6,99 Na etapa de teste, os modelos baseados em Redes Neurais Recorrentes (LSTM) obtiveram desempenho superior sobre os modelos de Box & Jenkins, com MAPE menor do que 7%. Este resultado pode ser considerado satisfatório dada a exiguidade de dados para modelagem. REFERÊNCIAS [1] G. Box and G. Jenkins, Time Series Analysis: Forecasting and Control. San Francisco: Holden-Day, 1970. [2] S. Hochreiter and J. Schmidhuber, “ Long short-term memory”, Neural Computation, 9(8):17351780, 1997. [3] R Core Team, R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria, 2019.