Publicación:
Modelo de predicción de venta en una compañía textil con técnicas de Machine Learning

Fecha

2025

Autores

Lezcano Echeverri, Jhon Wilder

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad EAFIT

Proyectos de investigación

Unidades organizativas

Número de la revista

Resumen

This study explores the implementation of sales forecasting models in a Colombian textile company, combining traditional techniques with Machine Learning-based approaches. Daily sales data from 187 stores between 2021 and 2025 were analyzed. The methodology followed five stages: (1) exploratory analysis, (2) feature engineering, (3) model implementation, (4) model optimization and fine-tunning, and (5) comparative validation. The models implemented were: Prophet, XGBoost, Random Forest, and regularized Linear Regression. Prophet achieved the best overall performance for units sold (R² = 0.7121), standing out for its ability to capture complex seasonal patterns and adapt to store-level variability. XGBoost demonstrated high accuracy in non-linear scenarios, Random Forest showed robustness to noise, and Linear Regression provided greater interpretability. Feature engineering resulted in 83 variables, including temporal components, trends, volatility, and special effects. A cross-sectional analysis revealed common patterns such as peak underestimation, higher error in smaller stores and weekends, and lower accuracy in predicting monetary values compared to units. The findings confirm that sales forecasting using Machine Learning offers substantial improvements over traditional methods, enhancing operational efficiency, inventory optimization, and financial planning. Prophet is recommended as the primary model, along with the establishment of monthly recalibration cycles to maintain accuracy.

Descripción

Este trabajo explora la implementación de modelos de predicción de ventas en una empresa del sector textil colombiano, a partir del uso combinado de técnicas tradicionales y enfoques basados en Machine Learning. Se analizaron datos de ventas diarias en 187 tiendas entre 2021 y 2025. Se desarrollaron cuatro fases metodológicas: (1) análisis exploratorio, (2) ingeniería de características, (3) implementación de modelos (4) Optimización y mejoras de los modelos y (5) validación comparativa. Se implementaron los modelos: Prophet, XGBoost, Random Forest y Regresión Lineal regularizada. Prophet obtuvo el mejor desempeño general en unidades (R² = 0.7121), destacándose por su capacidad para capturar patrones estacionales complejos y adaptarse a la variabilidad entre tiendas. Por su lado, XGBoost mostró alta precisión en escenarios no lineales, mientras que Random Forest ofreció robustez ante el ruido y la Regresión Lineal proporcionó mayor interpretabilidad. La ingeniería de características incorporó 83 variables, incluyendo componentes temporales, tendencias, volatilidad y efectos especiales. Mediante un análisis transversal se reveló tendencias comunes como la subestimación de picos, mayor error en tiendas pequeñas y fines de semana, y menor precisión al predecir montos monetarios con respecto a unitarios. Se concluye que la predicción de ventas mediante Machine Learning ofrece mejoras sustanciales respecto a los métodos tradicionales para una mayor eficiencia operativa, optimización de inventario y planificación financiera. Se recomienda adoptar Prophet como modelo principal y establecer ciclos mensuales de recalibración para mantener la precisión.

Citación