Segmentación de los flujos migratorios en Colombia : identificación de subgrupos y características comunes
Fecha
2024
Autores
Aguirre Marín, Cindy Vanessa
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad EAFIT
Resumen
The increase in global migration has intensified migratory flows, emerging as a relevant phenomenon for global, regional, and national policies. In Colombia, since 2015, Venezuelan migration has sparked interest in migratory flows. This study analyzes migratory flows to Colombia in 2023 using Machine Learning techniques. K-Means was applied in order to segment data from Migration Colombia, while UMAP was used to reduce the dimensionality of the data itself. The results reveal four main clusters, defined by the region of origin, reason for travel, host region, and month of arrival. Most flows correspond to tourists, suggesting that the data from official migration points primarily reflect tourist movements and not necessarily other types of migration. Machine Learning techniques proved effective in uncovering complex patterns in categorical data, and interpretation using SmartExplainer by SHAPash facilitated the understanding of these patterns. This study not only adequately segmented migratory flows but also provided interpretative tools for future analyses of categorical data.
Descripción
El aumento de la migración global ha intensificado los flujos migratorios, destacándose como un fenómeno relevante para las políticas globales, regionales y nacionales. En Colombia, a partir de 2015, la migración venezolana ha llevado a una mayor atención a los flujos migratorios. Este estudio analiza los flujos migratorios hacia Colombia en 2023 utilizando técnicas de aprendizaje automático. Con datos
de Migración Colombia, se aplicó K-Means para segmentar los flujos migratorios y UMAP para reducir la dimensionalidad de los datos. Los resultados revelan cuatro clusters principales, definidos por la región de origen, motivo del viaje, región de hospedaje y mes de llegada. La mayoría de los flujos corresponden a turistas, lo que sugiere que los datos de puntos migratorios oficiales reflejan principalmente movimientos turísticos y no necesariamente otros tipos de migración. Las técnicas de Machine Learning demostraron ser efectivas para descubrir patrones complejos en los datos categóricos, y la interpretación mediante SmartExplainer de SHAPash facilitó la comprensión de estos patrones. Este estudio no solo segmentó adecuadamente los flujos migratorios, sino que también proporcionó herramientas interpretativas para futuros análisis de datos categóricos