Modelos de predicción estocástica para bitcoin : una evaluación de métodos y desempeño
Fecha
2023
Autores
Forero Criollo, Juan Sebastián
Hernández Hernández, Caroline
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad EAFIT
Resumen
This research focuses on forecasting Bitcoin (BTC) prices using statistical models, including LSTM, GRU, SVR, decision trees, Random Forest, and XGBoost. We evaluate their performance in terms of R2, RSME, MAPE, Lin Concordance Coefficient (CCC), and Explained Variance Score—metrics selected for their ability to assess regression models.
We utilized BTC closing price data from 2014 to 2023, subjected to preprocessing involving cleaning, optimization, and data engineering. The models, initially unoptimized, were enhanced through hyperparameter tuning and specialized statistical techniques such as cross-validation, L1-L2 regularization, Bayesian and genetic optimization.
The results highlight XGBoost as the optimal model with the incorporation of iterative hyperparameter tuning, Bayesian optimization, and nested cross-validation. It achieved outstanding values in all evaluated metrics: RSME of USD 30.45, MAPE of 0.09%, R-squared of 1.0, Lin Concordance Coefficient, and Explained Variance Score of 1.0 in each case.
Descripción
La investigación se centra en pronosticar los precios del Bitcoin (BTC) mediante modelos estadísticos, incluyendo LSTM, GRU, SVR, árboles de decisión, Random Forest y XGBoost. Evaluamos su rendimiento en términos de R2, RSME, MAPE, Indicador de concordancia de Lin (CCC) y Explained Variance Score, métricas que se seleccionaron por su capacidad para evaluar modelos de regresión.
Se utilizaron datos de precios de cierre del BTC (2014-2023), sometidos a un preprocesamiento que incluyó limpieza, optimización e ingeniería de datos. Los modelos, inicialmente sin optimizaciones, se mejoraron mediante ajuste de hiperparámetros y técnicas estadísticas especializadas, como validación cruzada, regularización L1-L2, optimización bayesiana y genética.
Los resultados destacan el XGBoost como el modelo óptimo con la incorporación ajuste iterativo de hiperparámetros, optimización bayesiana y validación cruzada anidada. Este logró valores sobresalientes en todas las métricas evaluadas: RSME de USD 30,45, MAPE de 0,09%, R cuadrado de 1.0, CCC y Explained Variable Score (EVS) de 1.0 en cada caso.