Análisis y predicción de la deserción de empleados : un caso de estudio en la industria de software colombiana
dc.contributor.advisor | Almonacid Hurtado, Paula María | spa |
dc.contributor.author | Sierra Buriticá, Eliana Marcela | |
dc.coverage.spatial | Medellín de: Lat: 06 15 00 N degrees minutes Lat: 6.2500 decimal degrees Long: 075 36 00 W degrees minutes Long: -75.6000 decimal degrees | eng |
dc.creator.degree | Magíster en Ciencias de Datos y Analítica | spa |
dc.creator.email | emsierrab@eafit.edu.co | spa |
dc.date.accessioned | 2023-02-20T19:44:31Z | |
dc.date.available | 2023-02-20T19:44:31Z | |
dc.date.issued | 2022 | |
dc.description | El objetivo de este estudio es realizar el análisis y la predicción de la deserción de empleados de una compañía de software en Medellín, con base en una base de datos privada que contiene 19 características de 1497 trabajadores, donde 900 están activos en la empresa y el restante han abandonado su puesto de trabajo. En primer lugar, se realizó un análisis descriptivo y exploratorio, donde se encontró que había algunas variables que no aportaban información al modelo, como por ejemplo: Tipo de identificación, fecha de inicio de contrato, entre otras, también en esta parte se identificó la correlación de algunas variables y se procedió a eliminarlas del conjunto de características descriptivas del problema, ya que al dejarlas sería dejar información redundante en el modelo. En segundo lugar, se entrenaron 4 modelos de machine learning (Niave Bayes, Random Forest, Decision Tree, Logistic Regression) y se compararon los resultados obtenidos por cada uno, para así encontrar el que mejor se ajusta a la problemática de la deserción laboral, en este paso se encontró que el mejor clasificador de machine learning es un árbol de decisión (Decision Tree) con 14 capas, ya que métricas como su curva de aprendizaje y curva de ROC dieron resultados superiores al de los otros dos modelos entrenados. | spa |
dc.description.abstract | The objective of this study is to carry out the analysis and prediction of the desertion of employees of a software company in Medellín, based on a private database that contains 19 characteristics of 1497 workers, where 900 are active in the company and the rest have left their job. In the first place, a descriptive and exploratory analysis was carried out, where it was found that there was some variables that did not contribute information to the model, such as: Type of identification, start date of the contract, among others, also in this part the correlation of some variables and proceeded to eliminate them from the set of descriptive characteristics of the problem, since that leaving them would be leaving redundant information in the model. Second, they trained 4 machine learning models (Niave Bayes, Random Forest, Decision Tree, Logistic Regression) and the results obtained by each were compared, in order to find the one that best fits the problem of labor desertion, in this step it was found that the best classifier of machine learning is a decision tree (Decision Tree) with 14 layers, since metrics such as its curve of learning and ROC curve gave better results than the other two trained models. | spa |
dc.identifier.ddc | 658.314 S572 | |
dc.identifier.uri | http://hdl.handle.net/10784/32155 | |
dc.language.iso | spa | spa |
dc.publisher | Universidad EAFIT | spa |
dc.publisher.department | Escuela de Administración | spa |
dc.publisher.place | Medellín | spa |
dc.publisher.program | Maestría en Ciencias de los Datos y Analítica | spa |
dc.rights | Todos los derechos reservados | spa |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | spa |
dc.rights.local | Acceso abierto | spa |
dc.rights.uri | http://creativecommons.org/licenses/by-nd/4.0/deed.es | |
dc.subject | Deserción | spa |
dc.subject | Industria de software | spa |
dc.subject | Análisis exploratorio | spa |
dc.subject | Algoritmos de Machine Learning | spa |
dc.subject.keyword | Desertion | spa |
dc.subject.keyword | Software industry | spa |
dc.subject.lemb | TRABAJO Y TRABAJADORES | spa |
dc.subject.lemb | APRENDIZAJE AUTOMÁTICO (INTELIGENCIA ARTIFICIAL) | spa |
dc.subject.lemb | AUSENTISMO LABORAL | spa |
dc.subject.lemb | CIENCIA DE LA INFORMACIÓN | spa |
dc.title | Análisis y predicción de la deserción de empleados : un caso de estudio en la industria de software colombiana | spa |
dc.type | masterThesis | eng |
dc.type | info:eu-repo/semantics/masterThesis | eng |
dc.type.hasVersion | acceptedVersion | eng |
dc.type.local | Tesis de Maestría | spa |
dc.type.spa | Monografía | spa |
Archivos
Bloque original
1 - 3 de 3
No hay miniatura disponible
- Nombre:
- ElianaMarcela_SierraBuriticá_2022.pdf
- Tamaño:
- 1.3 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Trabajo de grado
No hay miniatura disponible
- Nombre:
- formulario_autorizacion_publicacion_obras.pdf.pdf
- Tamaño:
- 457.25 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Formulario autorización publicación obras
No hay miniatura disponible
- Nombre:
- carta_aprobacion_trabajo_grado_eafit.pdf.pdf
- Tamaño:
- 124.71 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Carta aprobación trabajo de grado
Bloque de licencias
1 - 1 de 1
No hay miniatura disponible
- Nombre:
- license.txt
- Tamaño:
- 2.5 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción: