Métodos de machine learning con algoritmos de clúster no supervisados, una alternativa de segmentación de las pymes colombianas para plantear estrategias de acuerdo con sus condiciones económicas
Fecha
2022
Autores
Ramírez Mendoza, Durley Yalile
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad EAFIT
Resumen
This research created a new grouping alternative using machine learning tools such as K-means
and agglomerative clustering models, based on financial information from 2016 to 2019 of
10,001 Colombian SMEs. From these models twelve clusters originated that have 98.44% of the
evaluated data and it was determined that the model that presented the best clustering result was
the agglomerative model which generates the following main groups: a first group with negative
margins and a debt exceeding 61%, a second group starting with a range between -10% to 40% of
its margins and a debt below 60%, and a third group with positive margins and a debt between 11
and 80%. Finally, these groups create strategies according to the economic conditions of each of
them.
Descripción
Esta investigación creó una nueva alternativa de agrupación utilizando herramientas de machine
learning como son los modelos K-means y el clúster aglomerativo, tomando como base la
información financiera de 2016 a 2019 de 10.001 pymes colombianas. A partir de estos modelos,
se originaron doce clústeres que tienen el 98,44% de los datos evaluados y se determinó que el
modelo que presentó mejores resultados de agrupación fue el modelo aglomerativo, el cual
genera los siguientes grupos principales: un primer grupo con márgenes negativos y un
endeudamiento superior al 61%, un segundo grupo que inicia con un intervalo entre el -10%
hasta el 40% de sus márgenes y un endeudamiento inferior al 60%, y un tercer grupo con
márgenes positivos y un endeudamiento entre el 11 y 80%. Finalmente, desde estos grupos se
crean estrategias de acuerdo con las condiciones económicas de cada uno de ellos.