Métodos de machine learning con algoritmos de clúster no supervisados, una alternativa de segmentación de las pymes colombianas para plantear estrategias de acuerdo con sus condiciones económicas

Resumen

This research created a new grouping alternative using machine learning tools such as K-means and agglomerative clustering models, based on financial information from 2016 to 2019 of 10,001 Colombian SMEs. From these models twelve clusters originated that have 98.44% of the evaluated data and it was determined that the model that presented the best clustering result was the agglomerative model which generates the following main groups: a first group with negative margins and a debt exceeding 61%, a second group starting with a range between -10% to 40% of its margins and a debt below 60%, and a third group with positive margins and a debt between 11 and 80%. Finally, these groups create strategies according to the economic conditions of each of them.

Descripción

Esta investigación creó una nueva alternativa de agrupación utilizando herramientas de machine learning como son los modelos K-means y el clúster aglomerativo, tomando como base la información financiera de 2016 a 2019 de 10.001 pymes colombianas. A partir de estos modelos, se originaron doce clústeres que tienen el 98,44% de los datos evaluados y se determinó que el modelo que presentó mejores resultados de agrupación fue el modelo aglomerativo, el cual genera los siguientes grupos principales: un primer grupo con márgenes negativos y un endeudamiento superior al 61%, un segundo grupo que inicia con un intervalo entre el -10% hasta el 40% de sus márgenes y un endeudamiento inferior al 60%, y un tercer grupo con márgenes positivos y un endeudamiento entre el 11 y 80%. Finalmente, desde estos grupos se crean estrategias de acuerdo con las condiciones económicas de cada uno de ellos.

Palabras clave

Pymes, Algoritmos no supervisados, Clúster, Clúster K-means, Clúster aglomerativo

Citación