Análisis y predicción de la deserción de empleados : un caso de estudio en la industria de software colombiana

dc.contributor.advisorAlmonacid Hurtado, Paula Maríaspa
dc.contributor.authorSierra Buriticá, Eliana Marcela
dc.coverage.spatialMedellín de: Lat: 06 15 00 N degrees minutes Lat: 6.2500 decimal degrees Long: 075 36 00 W degrees minutes Long: -75.6000 decimal degreeseng
dc.creator.degreeMagíster en Ciencias de Datos y Analíticaspa
dc.creator.emailemsierrab@eafit.edu.cospa
dc.date.accessioned2023-02-20T19:44:31Z
dc.date.available2023-02-20T19:44:31Z
dc.date.issued2022
dc.descriptionEl objetivo de este estudio es realizar el análisis y la predicción de la deserción de empleados de una compañía de software en Medellín, con base en una base de datos privada que contiene 19 características de 1497 trabajadores, donde 900 están activos en la empresa y el restante han abandonado su puesto de trabajo. En primer lugar, se realizó un análisis descriptivo y exploratorio, donde se encontró que había algunas variables que no aportaban información al modelo, como por ejemplo: Tipo de identificación, fecha de inicio de contrato, entre otras, también en esta parte se identificó la correlación de algunas variables y se procedió a eliminarlas del conjunto de características descriptivas del problema, ya que al dejarlas sería dejar información redundante en el modelo. En segundo lugar, se entrenaron 4 modelos de machine learning (Niave Bayes, Random Forest, Decision Tree, Logistic Regression) y se compararon los resultados obtenidos por cada uno, para así encontrar el que mejor se ajusta a la problemática de la deserción laboral, en este paso se encontró que el mejor clasificador de machine learning es un árbol de decisión (Decision Tree) con 14 capas, ya que métricas como su curva de aprendizaje y curva de ROC dieron resultados superiores al de los otros dos modelos entrenados.spa
dc.description.abstractThe objective of this study is to carry out the analysis and prediction of the desertion of employees of a software company in Medellín, based on a private database that contains 19 characteristics of 1497 workers, where 900 are active in the company and the rest have left their job. In the first place, a descriptive and exploratory analysis was carried out, where it was found that there was some variables that did not contribute information to the model, such as: Type of identification, start date of the contract, among others, also in this part the correlation of some variables and proceeded to eliminate them from the set of descriptive characteristics of the problem, since that leaving them would be leaving redundant information in the model. Second, they trained 4 machine learning models (Niave Bayes, Random Forest, Decision Tree, Logistic Regression) and the results obtained by each were compared, in order to find the one that best fits the problem of labor desertion, in this step it was found that the best classifier of machine learning is a decision tree (Decision Tree) with 14 layers, since metrics such as its curve of learning and ROC curve gave better results than the other two trained models.spa
dc.identifier.ddc658.314 S572
dc.identifier.urihttp://hdl.handle.net/10784/32155
dc.language.isospaspa
dc.publisherUniversidad EAFITspa
dc.publisher.departmentEscuela de Administraciónspa
dc.publisher.placeMedellínspa
dc.publisher.programMaestría en Ciencias de los Datos y Analíticaspa
dc.rightsTodos los derechos reservadosspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.localAcceso abiertospa
dc.rights.urihttp://creativecommons.org/licenses/by-nd/4.0/deed.es
dc.subjectDeserciónspa
dc.subjectIndustria de softwarespa
dc.subjectAnálisis exploratoriospa
dc.subjectAlgoritmos de Machine Learningspa
dc.subject.keywordDesertionspa
dc.subject.keywordSoftware industryspa
dc.subject.lembTRABAJO Y TRABAJADORESspa
dc.subject.lembAPRENDIZAJE AUTOMÁTICO (INTELIGENCIA ARTIFICIAL)spa
dc.subject.lembAUSENTISMO LABORALspa
dc.subject.lembCIENCIA DE LA INFORMACIÓNspa
dc.titleAnálisis y predicción de la deserción de empleados : un caso de estudio en la industria de software colombianaspa
dc.typemasterThesiseng
dc.typeinfo:eu-repo/semantics/masterThesiseng
dc.type.hasVersionacceptedVersioneng
dc.type.localTesis de Maestríaspa
dc.type.spaMonografíaspa

Archivos

Bloque original
Mostrando 1 - 3 de 3
No hay miniatura disponible
Nombre:
ElianaMarcela_SierraBuriticá_2022.pdf
Tamaño:
1.3 MB
Formato:
Adobe Portable Document Format
Descripción:
Trabajo de grado
No hay miniatura disponible
Nombre:
formulario_autorizacion_publicacion_obras.pdf.pdf
Tamaño:
457.25 KB
Formato:
Adobe Portable Document Format
Descripción:
Formulario autorización publicación obras
No hay miniatura disponible
Nombre:
carta_aprobacion_trabajo_grado_eafit.pdf.pdf
Tamaño:
124.71 KB
Formato:
Adobe Portable Document Format
Descripción:
Carta aprobación trabajo de grado
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
2.5 KB
Formato:
Item-specific license agreed upon to submission
Descripción: