Previsão de séries temporais de produtos vendidos no varejo
Previsão. Séries temporais. Generalização empilhada. Aprendizado de Máquina. Famílias de produtos.
A previsão da demanda de vendas é essencial para o planejamento estratégico e a gestão eficiente da cadeia de suprimentos. Essa prática permite que as organizações antecipem as necessidades do mercado, formando a base para o planejamento financeiro, o controle de estoques e a aquisição de produtos, reduzindo assim os custos. Nesse contexto, a adoção de modelos de Aprendizado de Máquina (ML) para previsão de séries temporais surge como uma ferramenta valiosa. Na presente pesquisa, o objetivo foi analisar a capacidade preditiva de modelos matemáticos individuais e de combinados através de uma abordagem de generalização empilhada, para a previsão de séries temporais do volume de vendas de produtos no segmento de varejo. Os modelos individuais foram treinados e, posteriormente, as cinco melhores previsões dentre os modelos ETS, SARIMA, k-NN, SVR, DTR, RFR, ETR, XGBoost, LightGBM, MLP e LSTM foram selecionadas com base no desempenho na medida MAAPE. Os modelos combinados utilizaram as saídas dos cinco modelos base selecionados na primeira etapa. Em seguida, foram escolhidos os quatro melhores combinadores para cada série temporal, incluindo os baseados na média simples (cSA), na mediana simples (cSM) e na variância mínima (cMV). Os experimentos envolvendo o cruzamento entre modelos resultaram em 165 combinações de modelos base e 132 combinações de metamodelos para o conjunto de séries temporais analisadas nesta pesquisa. Em seguida, foi realizada uma comparação de desempenho dos modelos propostos utilizando MAAPE, MAE e ME. A análise comparativa das séries temporais de demanda mostrou que os modelos combinados superaram os modelos individuais, com MAAPE variando de 6% a 46%. Em comparação com outros estudos, o método utilizado nesta pesquisa apresentou desempenho superior, com MAE variando de 28,4 a 70 unidades em algumas categorias de produtos, enquanto em outras o desempenho foi inferior, com MAE entre 128,9 e 357,4 unidades. Destaca-se que os modelos de stacking cSVR e cLSTM, no nível de lojas, superaram outros modelos, como SARIMA, ANN, CNN e o combinado CNN+LSTM. Enquanto os MAPE desses modelos variaram de 12,9% a 17,6%, os de stacking cSVR e cLSTM ficaram abaixo de 11,6%, destacando a eficácia dessa abordagem em previsões de séries temporais com elevada variabilidade.