Publicación: Inteligencia del mercado laboral colombiano : detección automatizada de habilidades mediante modelos grandes de lenguaje (LLM) y recuperación aumentada (RAG)
Fecha
2025-12-03
Autores
Zapata Posada, Jorge Mario
dc.contributor.advisor
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad EAFIT
Resumen
The demand for skills in the labor market has evolved significantly in recent decades, driven by changes in the economic environment and constant technological advances. In this context, the detailed description of each job offer, available on employment web portals, provides accurate information on the specific skills required by the market in real time. Labor Market Intelligence (LMI) research uses this data along with machine learning algorithms to anticipate trends and understand the evolution of talent demand.
Despite advances in artificial intelligence and the availability of large data volumes, there remains a gap in adapting these technologies to local contexts. Regional markets, such as Colombia, require customized approaches to ensure that technological solutions respond to the specific needs of the labor market, effectively aligning talent supply and demand.
This study analyzes data from the Talent.com employment platform for Colombia using a state-of-the-art approach based on Large Language Models (LLM) combined with Retrieval Augmented Generation (RAG) to identify emerging, traditional, technical, and soft skills. In the first stage, a multilingual LLM extracts skill mentions from job descriptions. In the second stage, a semantic retrieval module queries the European Commission’s open ESCO skills taxonomy to propose standardized candidate labels, the LLM then selects the most appropriate label and delivers validated, structured JSON outputs.
Preliminary results show improvements in precision, coverage, and auditability compared to purely supervised approaches, reducing hallucinations through candidate-constrained selection and standardizing categories using ESCO skill classification.
This framework provides valuable insights that, in future work, may support universities in designing academic programs aligned with labor market needs, thus facilitating strategic decision-making for employers, policymakers, and educators, and contributing to talent development and the reduction of unemployment in Colombia.
Descripción
La demanda de habilidades en el mercado laboral ha evolucionado significativamente en las últimas décadas, impulsada por cambios en el entorno económico y los constantes avances tecnológicos. En este contexto, la descripción detallada de cada oferta laboral, disponible en portales web de empleo, proporciona información precisa sobre las habilidades específicas que requiere el mercado en tiempo real. La investigación en inteligencia del mercado laboral (Labour Market Intelligence, LMI) utiliza estos datos en conjunto con algoritmos de aprendizaje automático para anticipar tendencias y comprender la evolución de la demanda de talento.
A pesar de los avances en inteligencia artificial y la disponibilidad de grandes volúmenes de datos, sigue existiendo una brecha en la adaptación de estas tecnologías al contexto local. Los mercados regionales, como el colombiano, requieren enfoques personalizados para garantizar que las soluciones tecnológicas respondan a las necesidades específicas del mercado laboral, alineando de manera efectiva la oferta y la demanda de talento.
Este estudio se enfoca en analizar los datos del portal web de empleo Talent.com para Colombia, mediante un enfoque de última generación basado en Modelos Grandes de Lenguaje (LLM) combinados con Recuperación Aumentada (RAG), para identificar habilidades emergentes, tradicionales, técnicas y blandas. En una primera etapa, un LLM multilingüe extrae menciones de habilidades a partir de descripciones de ofertas de trabajo. En una segunda etapa, un módulo de recuperación semántica consulta la taxonomía abierta de clasificación de
habilidades de la Comisión Europea (ESCO) para proponer candidatos normalizados, el LLM selecciona la etiqueta más adecuada y devuelve resultados estructurados en formato JSON validado.
Los resultados preliminares apuntan a mejoras en precisión, cobertura y auditabilidad frente a enfoques puramente supervisados, al reducir alucinaciones mediante la selección sobre candidatos recuperados y al estandarizar las categorías mediante la clasificación de habilidades ESCO.
Este marco proporciona información valiosa que en futuros trabajos permita a las instituciones universitarias desarrollar programas académicos alineados con las necesidades del mercado, facilitando así la toma de decisiones estratégicas por parte de empleadores, formuladores de políticas y educadores, contribuyendo al desarrollo del talento y a la reducción del desempleo en Colombia.
Citación
dc.relation.uri
dc.identifier.doi
dc.rights
Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0)