Aprendizaje automático para la identificación mineralógica de material particulado - Bogotá, Cali y Valle de Aburrá (Colombia)

Resumen

Identifying the mineral components present in particulate matter can be of great help to understand the dynamics of air pollution, especially to detect the presence of minerals that are dangerous for inhalation (such as asbestos). In this work is developed a methodology for the clustering of chemical data obtained through scanning electron microscopy with energy dispersive spectroscopy (SEM-EDX) in samples located in Bogota, Cali and Valle de Aburrá (Colombia). Rausch et al. (2022) and Avellaneda et al. (2020) develop and apply a methodology based on random forest algorithms to separate categories of particles, including minerals. In this work, a generalized algorithm based on DBSCAN is proposed as a complement. It allowed to analyze a set of 3716 samples previously classified as "mineral". The results reveal the presence of at least 15 different minerals. Despite a relatively low classification effectiveness (~20%), this work represents a significant advance in this area, as precedents are few or non-existent for this type of application. It is notable, also, that the presence of Serpentine (Antigorite variety) was detected in Medellín. The findings of this study reveal that most of the particles correspond to quartz, calcite, kaolinite and plagioclase. Despite the limitations, the algorithm demonstrates its effectiveness in mineral identification. However, improvements that could increase its accuracy are recognized. Overall, this study establishes a starting point for future chemical characterization analyses of particulate matter.

Descripción

Identificar los componentes minerales presentes en el material particulado puede ser de gran ayuda para comprender la dinámica de la polución aérea; sobre todo para detectar la presencia de minerales peligrosos por inhalación (como los asbestos). En este trabajo se desarrolla una metodología para el agrupamiento de datos químicos obtenidos a través de microscopía electrónica de barrido con espectroscopía de energía dispersiva (SEM-EDX) en muestreos ubicados en Bogotá, Cali y Valle de Aburrá (Colombia). Rausch et al. (2022) y Avellaneda et al. (2020) desarrollan y aplican una metodología basada en algoritmos de bosques aleatorios que permite separar categorías de partículas, entre ellas minerales. En este trabajo se desarrolla un algoritmo generalizado basado en DBSCAN como complemento. Que permitió analizar un conjunto de 3716 muestras previamente clasificadas como "mineral”. Los resultados revelan la presencia de al menos 15 minerales distintos. A pesar de una efectividad de clasificación relativamente baja (~20%), este trabajo representa un avance significativo en esta área, pues los precedentes son pocos o inexistentes para este tipo de aplicaciones. Es notable, también, que se detectó la presencia de Serpentina (variedad Antigorita) en Medellín. Las conclusiones de este estudio revelan que la mayoría de las partículas corresponden a cuarzo, calcita, caolinita y plagioclasas. A pesar de las limitaciones, el algoritmo demuestra su eficacia para la identificación de minerales. No obstante, se reconocen posibles mejoras que podrían aumentar su precisión. En conjunto, este estudio establece un punto de partida para futuros análisis de caracterización química del material particulado.

Palabras clave

Polución atmosférica, Caracterización química, Algoritmos de agrupamiento

Citación