Martínez Vargas, Juan DavidSepúlveda Cano, Lina María2024-10-012024https://hdl.handle.net/10784/34651El aumento de la migración global ha intensificado los flujos migratorios, destacándose como un fenómeno relevante para las políticas globales, regionales y nacionales. En Colombia, a partir de 2015, la migración venezolana ha llevado a una mayor atención a los flujos migratorios. Este estudio analiza los flujos migratorios hacia Colombia en 2023 utilizando técnicas de aprendizaje automático. Con datos de Migración Colombia, se aplicó K-Means para segmentar los flujos migratorios y UMAP para reducir la dimensionalidad de los datos. Los resultados revelan cuatro clusters principales, definidos por la región de origen, motivo del viaje, región de hospedaje y mes de llegada. La mayoría de los flujos corresponden a turistas, lo que sugiere que los datos de puntos migratorios oficiales reflejan principalmente movimientos turísticos y no necesariamente otros tipos de migración. Las técnicas de Machine Learning demostraron ser efectivas para descubrir patrones complejos en los datos categóricos, y la interpretación mediante SmartExplainer de SHAPash facilitó la comprensión de estos patrones. Este estudio no solo segmentó adecuadamente los flujos migratorios, sino que también proporcionó herramientas interpretativas para futuros análisis de datos categóricosThe increase in global migration has intensified migratory flows, emerging as a relevant phenomenon for global, regional, and national policies. In Colombia, since 2015, Venezuelan migration has sparked interest in migratory flows. This study analyzes migratory flows to Colombia in 2023 using Machine Learning techniques. K-Means was applied in order to segment data from Migration Colombia, while UMAP was used to reduce the dimensionality of the data itself. The results reveal four main clusters, defined by the region of origin, reason for travel, host region, and month of arrival. Most flows correspond to tourists, suggesting that the data from official migration points primarily reflect tourist movements and not necessarily other types of migration. Machine Learning techniques proved effective in uncovering complex patterns in categorical data, and interpretation using SmartExplainer by SHAPash facilitated the understanding of these patterns. This study not only adequately segmented migratory flows but also provided interpretative tools for future analyses of categorical data.spaTodos los derechos reservadosFlujos migratoriosUMAPSHAPSegmentación de los flujos migratorios en Colombia : identificación de subgrupos y características comunesmasterThesisinfo:eu-repo/semantics/openAccessAPRENDIZAJE AUTOMÁTICO (INTELIGENCIA ARTIFICIAL)CIENCIA DE LA INFORMACIÓNMIGRACIÓN HUMANADATOS ESTADÍSTICOSMigratory flowsClusteringMachine LearningK-MeansAcceso abierto2024-10-01Aguirre Marín, Cindy Vanessa