Determinantes del riesgo de incumplimiento en créditos educativos : un análisis para Colombia

Resumen

This document uses non-parametric Machine Learning methodologies, in particular the XGBoost algorithm, to predict the risk of non-compliance with educational credits in Colombia offered by ICETEX between 2015 and 2018. The interest variable is the risk of default in student credits and is used as variable determinants associated with the socioeconomic level of students, as well as school information and academic achievement for each student. The main results show that socioeconomic variables with very good default predictors, in particular variables such as parent education and scores on critical reading tests are strong predictors. The results found contribute to economic and social policy decisions on the design of methods for higher education coverage through meritorious credits with public and private funds.

Descripción

En este documento se utilizan metodologías no paramétricas de Machine Learning, en particular el algoritmo XGBoost, para predecir el riesgo de incumplimiento en los créditos educativos en Colombia ofrecidos por el ICETEX entre los años 2015 a 2018. La variable de interés es el riesgo de incumplimiento en créditos estudiantiles (default) y se utilizan como determinantes variables asociadas al nivel socioeconómico de los estudiantes, así como la información del colegio y el logro académico de cada estudiante. Los principales resultados muestran que las variables socioeconómicas con muy buenos predictores del default, en particular, variables como la educación de los padres y los puntajes en las pruebas de lectura crítica son fuertes predictores. Los resultados encontrados contribuyen a las decisiones de política económica y social sobre el diseño de métodos para la cobertura de educación superior a través de créditos meritorios con fondos públicos y privados.

Palabras clave

Educación Superior, XGBoost, Educación, Créditos educativos, Icetex

Citación