Publicación:
Análisis comparativo de modelos predictivos para la estimación de PM2.5 : un enfoque basado en aprendizaje automático y predicción conformal

dc.contributor.advisorMartínez Vargas, Juan David
dc.contributor.advisorSepúlveda Cano, Lina Maria
dc.contributor.authorCamelo Valera, Matías
dc.coverage.spatialMedellín de: Lat: 06 15 00 N degrees minutes Lat: 6.2500 decimal degrees Long: 075 36 00 W degrees minutes Long: -75.6000 decimal degreeseng
dc.creator.degreeMagíster en Ciencias de Datos y Analíticaspa
dc.creator.emailmcamelov@eafit.edu.co
dc.date.accessioned2025-04-29T21:10:28Z
dc.date.available2025-04-29T21:10:28Z
dc.date.issued2024
dc.descriptionLa contaminación por material particulado fino (𝑃𝑀2.5) representa un desafío ambiental y de salud pública, requiriendo modelos predictivos precisos para su monitoreo y control. En este trabajo, se comparan diferentes enfoques de aprendizaje automático, incluyendo Regresión Lineal, Random Forest y XGBoost, con y sin la inclusión de variables de movilidad, para estimar los niveles de 𝑃𝑀2.5. Además, se implementa la predicción conformal inductiva para cuantificar la incertidumbre en las estimaciones y proporcionar intervalos de confianza con 𝛼=0.05. Los resultados evidencian que XGBoost, pese a experimentar un deterioro en la fase de entrenamiento al incluir variables de movilidad, logra el mejor desempeño en validación con un menor error absoluto medio y mayor coeficiente de determinación. La predicción conformal permitió establecer intervalos de confianza con una cobertura del 89.26%, cercana al 95% esperado, lo que garantiza la fiabilidad del modelo en distintos escenarios espaciales y temporales. En conclusión, el uso de modelos de aprendizaje automático en combinación con técnicas avanzadas de validación y calibración, como la predicción conformal, permite mejorar la precisión y confiabilidad en la estimación de 𝑃𝑀2.5. Sin embargo, la calidad de las variables de entrada, especialmente las de movilidad, sigue representando un desafío, lo que sugiere la necesidad de incorporar información meteorológica y mejorar la resolución de los datos. Estos hallazgos contribuyen al desarrollo de herramientas predictivas más fiables para la gestión ambiental y la toma de decisiones en políticas de calidad del aire.
dc.description.abstractFine particulate matter (𝑃𝑀2.5pollution poses a significant environmental and public health challenge, requiring accurate predictive models for its monitoring and control. This study compares different machine learning approaches, including Linear Regression, Random Forest, and XGBoost, with and without the inclusion of mobility variables, to estimate 𝑃𝑀2.5 levels. Additionally, inductive conformal prediction is implemented to quantify uncertainty in the estimates and provide confidence intervals with 𝛼=0.05. The results show that while XGBoost experiences performance deterioration during training when mobility variables are included, it achieves the best validation performance with the lowest mean absolute error and the highest coefficient of determination. Conformal prediction enabled the establishment of confidence intervals with 89.26% coverage, close to the expected 95%, ensuring model reliability across different spatial and temporal scenarios. In conclusion, the use of machine learning models combined with advanced validation and calibration techniques, such as conformal prediction, enhances the accuracy and reliability of 𝑃𝑀2.5 estimation. However, the quality of input variables, particularly mobility-related data, remains a challenge, highlighting the need to incorporate meteorological information and improve data resolution. These findings contribute to the development of more reliable predictive tools for environmental management and air quality policy decision-making.
dc.identifier.urihttps://hdl.handle.net/10784/35381
dc.language.isospaspa
dc.publisherUniversidad EAFITspa
dc.publisher.departmentEscuela de Ciencias Aplicadas e Ingeniería. Área Computación y Analíticaspa
dc.publisher.placeMedellín
dc.publisher.programMaestría en Ciencias de los Datos y Analíticaspa
dc.relation.urihttps://github.com/Matu10100/AirQuality_Prediction
dc.rightsTodos los derechos reservadosspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccesseng
dc.rights.localAcceso abiertospa
dc.subjectCalidad del aire
dc.subjectPM2.5
dc.subjectPredictor
dc.subjectAprendizaje automático
dc.subjectSerie de tiempo
dc.subjectPredicción conformal
dc.subject.keywordAir quality
dc.subject.keywordPredictive model
dc.subject.keywordMachine Learning
dc.subject.keywordTime series
dc.subject.keywordConformal prediction
dc.subject.lembCIENCIA DE LA INFORMACIÓN
dc.subject.lembAPRENDIZAJE AUTOMÁTICO (INTELIGENCIA ARTIFICIAL)
dc.subject.lembGESTIÓN AMBIENTAL
dc.subject.lembINGENIERÍA ECOLÓGICA
dc.titleAnálisis comparativo de modelos predictivos para la estimación de PM2.5 : un enfoque basado en aprendizaje automático y predicción conformal
dc.typemasterThesiseng
dc.typeinfo:eu-repo/semantics/masterThesiseng
dc.type.hasVersionacceptedVersioneng
dc.type.localTesis de Maestríaspa
dc.type.spaArtículo
dspace.entity.typePublication

Archivos

Bloque original
Mostrando 1 - 3 de 3
No hay miniatura disponible
Nombre:
Matias_CameloValera_2024.pdf
Tamaño:
2.35 MB
Formato:
Adobe Portable Document Format
Descripción:
Trabajo de grado
No hay miniatura disponible
Nombre:
formulario_autorizacion_publicacion_obras.pdf
Tamaño:
427.63 KB
Formato:
Adobe Portable Document Format
Descripción:
Formulario de autorización de publicación de obras
No hay miniatura disponible
Nombre:
carta_aprobacion_trabajo_grado_eafit..pdf
Tamaño:
265.7 KB
Formato:
Adobe Portable Document Format
Descripción:
Carta de aprobación de tesis de grado
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
2.5 KB
Formato:
Item-specific license agreed upon to submission
Descripción: