Publicación: Predicción del precio óptimo de compra de sacos de papel en la industria cementera : un enfoque basado en modelos SARIMAX, ARIMA y red neuronal LSTM
Fecha
2025-12-09
Autores
Morales Martínez, Andrés Felipe
dc.contributor.advisor
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad EAFIT
Resumen
This research addresses the problem of forecasting the purchase price of kraft paper sacks in the Colombian cement industry, within a context characterized by high price uncertainty and the absence of financial hedging instruments. Using internal transactional data extracted from the ERP system for the 2014–2023 period, together with public exogenous variables such as the exchange rate (TRM) and stock prices of global suppliers in the paper industry, a reproducible dataset was built for purchase price forecasting.
The study compared the performance of four time-series approaches: ARIMA, SARIMAX, LSTM, and LightGBM, under a 90/10 temporal validation protocol and strict control of information leakage. As a central part of the methodology, a daily time series was reconstructed using the LOCF technique, and feature engineering was incorporated to better represent the stepwise nature of the price series.
The results show that linear models and the LSTM applied to the original series produced high forecasting errors, whereas the best performance was achieved by nonlinear models applied to the transformed series. In particular, the LSTM with the transformed daily series achieved the best overall result (MAE = 4.57 COP), followed by LightGBM (MAE = 8.03 COP), clearly outperforming ARIMA and SARIMAX.
It is concluded that an adequate representation of the time series is as important as the selection of the predictive model, and that the combination of internal data, exogenous variables, and nonlinear methods can generate useful operational signals to support more timely, objective, and data-driven purchasing decisions in industrial sourcing contexts.
Descripción
Esta investigación aborda el problema de la predicción del precio de compra de sacos de papel kraft en la industria cementera colombiana, en un contexto caracterizado por alta incertidumbre de precios y ausencia de instrumentos de cobertura financiera. A partir de datos transaccionales internos extraídos del ERP para el período 2014–2023 y de variables exógenas públicas, como la TRM y precios de acciones de proveedores globales del sector papelero, se construyó un conjunto de datos reproducible orientado al pronóstico del precio de compra.
El estudio comparó el desempeño de cuatro enfoques de series de tiempo: ARIMA, SARIMAX, LSTM y LightGBM, bajo un protocolo de validación temporal 90/10 y control estricto de fuga de información. Como parte central de la metodología, se reconstruyó una serie diaria mediante la técnica LOCF y se incorporó ingeniería de características para representar de mejor manera la naturaleza escalonada del precio.
Los resultados muestran que los modelos lineales y el LSTM aplicado sobre la serie original presentan errores elevados, mientras que los mejores desempeños se obtuvieron con los modelos no lineales sobre la serie transformada. En particular, el LSTM con serie diaria transformada alcanzó el mejor resultado global (MAE = 4,57 COP), seguido de LightGBM (MAE = 8,03 COP), superando ampliamente a ARIMA y SARIMAX.
Se concluye que la representación adecuada de la serie es tan importante como la elección del modelo predictivo, y que la combinación de datos internos, variables exógenas y métodos no lineales puede generar señales operativas útiles para apoyar decisiones de compra más oportunas, objetivas y basadas en datos en contextos de abastecimiento industria
Palabras clave
Citación
dc.relation.uri
dc.identifier.doi
dc.rights
Todos los derechos reservados