Publicación: Inteligencia del mercado laboral colombiano : detección automatizada de habilidades mediante modelos grandes de lenguaje (LLM) y recuperación aumentada (RAG)
| dc.contributor.advisor | Álvarez Barrera, Claudia Patricia | |
| dc.contributor.advisor | Padilla Buritica, Jorge Iván | |
| dc.contributor.author | Zapata Posada, Jorge Mario | |
| dc.coverage.spatial | Medellín de: Lat: 06 15 00 N degrees minutes Lat: 6.2500 decimal degrees Long: 075 36 00 W degrees minutes Long: -75.6000 decimal degrees | |
| dc.creator.email | jmzapatap@eafit.edu.co | |
| dc.date.accessioned | 2026-05-22T20:33:34Z | |
| dc.date.available | 2026-05-22T20:33:34Z | |
| dc.date.issued | 2025-12-03 | |
| dc.description | La demanda de habilidades en el mercado laboral ha evolucionado significativamente en las últimas décadas, impulsada por cambios en el entorno económico y los constantes avances tecnológicos. En este contexto, la descripción detallada de cada oferta laboral, disponible en portales web de empleo, proporciona información precisa sobre las habilidades específicas que requiere el mercado en tiempo real. La investigación en inteligencia del mercado laboral (Labour Market Intelligence, LMI) utiliza estos datos en conjunto con algoritmos de aprendizaje automático para anticipar tendencias y comprender la evolución de la demanda de talento. A pesar de los avances en inteligencia artificial y la disponibilidad de grandes volúmenes de datos, sigue existiendo una brecha en la adaptación de estas tecnologías al contexto local. Los mercados regionales, como el colombiano, requieren enfoques personalizados para garantizar que las soluciones tecnológicas respondan a las necesidades específicas del mercado laboral, alineando de manera efectiva la oferta y la demanda de talento. Este estudio se enfoca en analizar los datos del portal web de empleo Talent.com para Colombia, mediante un enfoque de última generación basado en Modelos Grandes de Lenguaje (LLM) combinados con Recuperación Aumentada (RAG), para identificar habilidades emergentes, tradicionales, técnicas y blandas. En una primera etapa, un LLM multilingüe extrae menciones de habilidades a partir de descripciones de ofertas de trabajo. En una segunda etapa, un módulo de recuperación semántica consulta la taxonomía abierta de clasificación de habilidades de la Comisión Europea (ESCO) para proponer candidatos normalizados, el LLM selecciona la etiqueta más adecuada y devuelve resultados estructurados en formato JSON validado. Los resultados preliminares apuntan a mejoras en precisión, cobertura y auditabilidad frente a enfoques puramente supervisados, al reducir alucinaciones mediante la selección sobre candidatos recuperados y al estandarizar las categorías mediante la clasificación de habilidades ESCO. Este marco proporciona información valiosa que en futuros trabajos permita a las instituciones universitarias desarrollar programas académicos alineados con las necesidades del mercado, facilitando así la toma de decisiones estratégicas por parte de empleadores, formuladores de políticas y educadores, contribuyendo al desarrollo del talento y a la reducción del desempleo en Colombia. | |
| dc.description.abstract | The demand for skills in the labor market has evolved significantly in recent decades, driven by changes in the economic environment and constant technological advances. In this context, the detailed description of each job offer, available on employment web portals, provides accurate information on the specific skills required by the market in real time. Labor Market Intelligence (LMI) research uses this data along with machine learning algorithms to anticipate trends and understand the evolution of talent demand. Despite advances in artificial intelligence and the availability of large data volumes, there remains a gap in adapting these technologies to local contexts. Regional markets, such as Colombia, require customized approaches to ensure that technological solutions respond to the specific needs of the labor market, effectively aligning talent supply and demand. This study analyzes data from the Talent.com employment platform for Colombia using a state-of-the-art approach based on Large Language Models (LLM) combined with Retrieval Augmented Generation (RAG) to identify emerging, traditional, technical, and soft skills. In the first stage, a multilingual LLM extracts skill mentions from job descriptions. In the second stage, a semantic retrieval module queries the European Commission’s open ESCO skills taxonomy to propose standardized candidate labels, the LLM then selects the most appropriate label and delivers validated, structured JSON outputs. Preliminary results show improvements in precision, coverage, and auditability compared to purely supervised approaches, reducing hallucinations through candidate-constrained selection and standardizing categories using ESCO skill classification. This framework provides valuable insights that, in future work, may support universities in designing academic programs aligned with labor market needs, thus facilitating strategic decision-making for employers, policymakers, and educators, and contributing to talent development and the reduction of unemployment in Colombia. | |
| dc.description.degreelevel | Maestría | spa |
| dc.description.degreename | Magíster en Ciencias de Datos y Analítica | spa |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | instname:Universidad EAFIT | |
| dc.identifier.reponame | reponame:Repositorio Institucional Universidad EAFIT | |
| dc.identifier.repourl | repourl:https://repository.eafit.edu.co | |
| dc.identifier.uri | https://hdl.handle.net/10784/37613 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad EAFIT | spa |
| dc.publisher.department | Área Computación y Analítica | spa |
| dc.publisher.faculty | Escuela de Ciencias Aplicadas e Ingeniería | spa |
| dc.publisher.place | Medellín | |
| dc.publisher.program | Maestría en Ciencias de los Datos y Analítica | spa |
| dc.relation.uri | https://github.com/jorgeposadaz/LMI_Colombia | |
| dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0) | spa |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
| dc.rights.local | Acceso abierto | |
| dc.rights.uri | http://creativecommons.org/licenses/by/4.0/deed.es | |
| dc.subject | Inteligencia del mercado laboral (LMI) | |
| dc.subject | Procesamiento de Lenguaje Natural (NLP) | |
| dc.subject | Talent.com | |
| dc.subject | Mercado laboral colombiano | |
| dc.subject | Modelos Grandes de Lenguaje (LLM) | |
| dc.subject | Recuperación Aumentada (RAG) | |
| dc.subject.keyword | Labour Market Intelligence (LMI) | |
| dc.subject.keyword | Natural Language Processing (NLP) | |
| dc.subject.keyword | Colombian labor market | |
| dc.subject.keyword | Large Language Models (LLM) | |
| dc.subject.keyword | Retrieval Augmented Generation (RAG) | |
| dc.subject.lemb | MERCADO LABORAL - COLOMBIA - INNOVACIONES TECNOLÓGICAS | |
| dc.subject.lemb | CAPITAL INTELECTUAL - COLOMBIA | |
| dc.subject.lemb | CIENCIA DE LA INFORMACIÓN | |
| dc.subject.lemb | SISTEMAS DE ALMACENAMIENTO Y RECUPERACIÓN DE INFORMACIÓN | |
| dc.title | Inteligencia del mercado laboral colombiano : detección automatizada de habilidades mediante modelos grandes de lenguaje (LLM) y recuperación aumentada (RAG) | |
| dc.type | info:eu-repo/semantics/masterThesis | |
| dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
| dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | |
| dc.type.local | Tesis de Maestría | spa |
| dc.type.redcol | http://purl.org/redcol/resource_type/TM | |
| dc.type.spa | Monografía | |
| dc.type.version | info:eu-repo/semantics/acceptedVersion | |
| dspace.entity.type | Publication |
Archivos
Bloque original
1 - 3 de 3
No hay miniatura disponible
- Nombre:
- Tesis - Jorge Mario Zapata Posada.pdf
- Tamaño:
- 1.92 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Trabajo de grado
No hay miniatura disponible
- Nombre:
- Carta aprobacion trabajo grado.pdf
- Tamaño:
- 317.07 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Carta de aprobación de tesis de grado
No hay miniatura disponible
- Nombre:
- formulario_autorizacion_publicacion_obras_biblioteca_firmado.pdf
- Tamaño:
- 551.22 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Formulario de autorización de publicación de obras
Bloque de licencias
1 - 1 de 1
No hay miniatura disponible
- Nombre:
- license.txt
- Tamaño:
- 2.74 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción: