Publicación:
Inteligencia del mercado laboral colombiano : detección automatizada de habilidades mediante modelos grandes de lenguaje (LLM) y recuperación aumentada (RAG)

dc.contributor.advisorÁlvarez Barrera, Claudia Patricia
dc.contributor.advisorPadilla Buritica, Jorge Iván
dc.contributor.authorZapata Posada, Jorge Mario
dc.coverage.spatialMedellín de: Lat: 06 15 00 N degrees minutes Lat: 6.2500 decimal degrees Long: 075 36 00 W degrees minutes Long: -75.6000 decimal degrees
dc.creator.emailjmzapatap@eafit.edu.co
dc.date.accessioned2026-05-22T20:33:34Z
dc.date.available2026-05-22T20:33:34Z
dc.date.issued2025-12-03
dc.descriptionLa demanda de habilidades en el mercado laboral ha evolucionado significativamente en las últimas décadas, impulsada por cambios en el entorno económico y los constantes avances tecnológicos. En este contexto, la descripción detallada de cada oferta laboral, disponible en portales web de empleo, proporciona información precisa sobre las habilidades específicas que requiere el mercado en tiempo real. La investigación en inteligencia del mercado laboral (Labour Market Intelligence, LMI) utiliza estos datos en conjunto con algoritmos de aprendizaje automático para anticipar tendencias y comprender la evolución de la demanda de talento. A pesar de los avances en inteligencia artificial y la disponibilidad de grandes volúmenes de datos, sigue existiendo una brecha en la adaptación de estas tecnologías al contexto local. Los mercados regionales, como el colombiano, requieren enfoques personalizados para garantizar que las soluciones tecnológicas respondan a las necesidades específicas del mercado laboral, alineando de manera efectiva la oferta y la demanda de talento. Este estudio se enfoca en analizar los datos del portal web de empleo Talent.com para Colombia, mediante un enfoque de última generación basado en Modelos Grandes de Lenguaje (LLM) combinados con Recuperación Aumentada (RAG), para identificar habilidades emergentes, tradicionales, técnicas y blandas. En una primera etapa, un LLM multilingüe extrae menciones de habilidades a partir de descripciones de ofertas de trabajo. En una segunda etapa, un módulo de recuperación semántica consulta la taxonomía abierta de clasificación de habilidades de la Comisión Europea (ESCO) para proponer candidatos normalizados, el LLM selecciona la etiqueta más adecuada y devuelve resultados estructurados en formato JSON validado. Los resultados preliminares apuntan a mejoras en precisión, cobertura y auditabilidad frente a enfoques puramente supervisados, al reducir alucinaciones mediante la selección sobre candidatos recuperados y al estandarizar las categorías mediante la clasificación de habilidades ESCO. Este marco proporciona información valiosa que en futuros trabajos permita a las instituciones universitarias desarrollar programas académicos alineados con las necesidades del mercado, facilitando así la toma de decisiones estratégicas por parte de empleadores, formuladores de políticas y educadores, contribuyendo al desarrollo del talento y a la reducción del desempleo en Colombia.
dc.description.abstractThe demand for skills in the labor market has evolved significantly in recent decades, driven by changes in the economic environment and constant technological advances. In this context, the detailed description of each job offer, available on employment web portals, provides accurate information on the specific skills required by the market in real time. Labor Market Intelligence (LMI) research uses this data along with machine learning algorithms to anticipate trends and understand the evolution of talent demand. Despite advances in artificial intelligence and the availability of large data volumes, there remains a gap in adapting these technologies to local contexts. Regional markets, such as Colombia, require customized approaches to ensure that technological solutions respond to the specific needs of the labor market, effectively aligning talent supply and demand. This study analyzes data from the Talent.com employment platform for Colombia using a state-of-the-art approach based on Large Language Models (LLM) combined with Retrieval Augmented Generation (RAG) to identify emerging, traditional, technical, and soft skills. In the first stage, a multilingual LLM extracts skill mentions from job descriptions. In the second stage, a semantic retrieval module queries the European Commission’s open ESCO skills taxonomy to propose standardized candidate labels, the LLM then selects the most appropriate label and delivers validated, structured JSON outputs. Preliminary results show improvements in precision, coverage, and auditability compared to purely supervised approaches, reducing hallucinations through candidate-constrained selection and standardizing categories using ESCO skill classification. This framework provides valuable insights that, in future work, may support universities in designing academic programs aligned with labor market needs, thus facilitating strategic decision-making for employers, policymakers, and educators, and contributing to talent development and the reduction of unemployment in Colombia.
dc.description.degreelevelMaestríaspa
dc.description.degreenameMagíster en Ciencias de Datos y Analíticaspa
dc.format.mimetypeapplication/pdf
dc.identifier.instnameinstname:Universidad EAFIT
dc.identifier.reponamereponame:Repositorio Institucional Universidad EAFIT
dc.identifier.repourlrepourl:https://repository.eafit.edu.co
dc.identifier.urihttps://hdl.handle.net/10784/37613
dc.language.isospa
dc.publisherUniversidad EAFITspa
dc.publisher.departmentÁrea Computación y Analíticaspa
dc.publisher.facultyEscuela de Ciencias Aplicadas e Ingenieríaspa
dc.publisher.placeMedellín
dc.publisher.programMaestría en Ciencias de los Datos y Analíticaspa
dc.relation.urihttps://github.com/jorgeposadaz/LMI_Colombia
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0) spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.localAcceso abierto
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/deed.es
dc.subjectInteligencia del mercado laboral (LMI)
dc.subjectProcesamiento de Lenguaje Natural (NLP)
dc.subjectTalent.com
dc.subjectMercado laboral colombiano
dc.subjectModelos Grandes de Lenguaje (LLM)
dc.subjectRecuperación Aumentada (RAG)
dc.subject.keywordLabour Market Intelligence (LMI)
dc.subject.keywordNatural Language Processing (NLP)
dc.subject.keywordColombian labor market
dc.subject.keywordLarge Language Models (LLM)
dc.subject.keywordRetrieval Augmented Generation (RAG)
dc.subject.lembMERCADO LABORAL - COLOMBIA - INNOVACIONES TECNOLÓGICAS
dc.subject.lembCAPITAL INTELECTUAL - COLOMBIA
dc.subject.lembCIENCIA DE LA INFORMACIÓN
dc.subject.lembSISTEMAS DE ALMACENAMIENTO Y RECUPERACIÓN DE INFORMACIÓN
dc.titleInteligencia del mercado laboral colombiano : detección automatizada de habilidades mediante modelos grandes de lenguaje (LLM) y recuperación aumentada (RAG)
dc.typeinfo:eu-repo/semantics/masterThesis
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.localTesis de Maestríaspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TM
dc.type.spaMonografía
dc.type.versioninfo:eu-repo/semantics/acceptedVersion
dspace.entity.typePublication

Archivos

Bloque original
Mostrando 1 - 3 de 3
No hay miniatura disponible
Nombre:
Tesis - Jorge Mario Zapata Posada.pdf
Tamaño:
1.92 MB
Formato:
Adobe Portable Document Format
Descripción:
Trabajo de grado
No hay miniatura disponible
Nombre:
Carta aprobacion trabajo grado.pdf
Tamaño:
317.07 KB
Formato:
Adobe Portable Document Format
Descripción:
Carta de aprobación de tesis de grado
No hay miniatura disponible
Nombre:
formulario_autorizacion_publicacion_obras_biblioteca_firmado.pdf
Tamaño:
551.22 KB
Formato:
Adobe Portable Document Format
Descripción:
Formulario de autorización de publicación de obras
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
2.74 KB
Formato:
Item-specific license agreed upon to submission
Descripción: