Predicción del rendimiento de cultivos agrícolas en los cinco corregimientos de la ciudad de Medellín, utilizando modelos de Machine Learning

Resumen

In a global context where agriculture and food production play a crucial role in food security, employment, and sustainability, this study focuses on predicting the yield of agricultural crops in the five districts of Medellín. The main objective is to design a prediction model for nine local crops using machine learning techniques. Medellín is distinguished by its diversity of crops, including peri-urban agriculture characterized by productive small plots distributed across various chagra-type crops. These traditional agricultural practices are carried out by an aging population of farmers. Accuracy in yield prediction becomes essential, as a significant portion of the production is dedicated to self-consumption, with a subsistence focus. However, surpluses are also traded, directly impacting the food security of the local community. The results highlight the effectiveness of machine learning models, particularly Boosting models such as PCA Random Forest and PCA XGB Boosting, in predicting the crops under study. These models demonstrate the ability to capture relationships between variables and the heterogeneity present in territorial production. However, opportunities for improvement related to reducing model errors have been identified, which can be addressed through continuous data collection and technical support provided to farmers. This will not only increase data availability but also contribute to refining the model and understanding performance behavior in the analyzed crops, facilitating decision-making in the agricultural sector of the municipality of Medellín. This project represents a valuable tool for professionals in the agricultural sector and institutions responsible for planning and agricultural development. It offers an innovative approach to sector data analysis, leveraging the advantages of data science. Through these techniques, opportunities are opened to establish strategies, plans, and projects that contribute to crop planning, the management of productive areas in the municipality, and the strengthening of local food security.

Descripción

En un contexto global donde la agricultura y la producción de alimentos desempeñan un papel crucial para la seguridad alimentaria, el empleo y la sostenibilidad, este estudio se centra en predecir rendimiento de los cultivos agrícolas presentes en los cinco corregimientos de Medellín. El objetivo principal consiste en diseñar un modelo de predicción para nueve cultivos locales mediante el uso de técnicas de aprendizaje automático (Machine Learning). Medellín se distingue por su diversidad de cultivos, que incluyen una agricultura periurbana caracterizada por microparcelas productivas distribuidas en varios cultivos de tipo chagra. Estas prácticas agrícolas tradicionales son llevadas a cabo por una población de agricultores envejecida. La precisión en la predicción del rendimiento se vuelve esencial, ya que una parte significativa de la producción se destina al autoconsumo, con un enfoque de subsistencia. Sin embargo, también se comercializan excedentes, lo que impacta directamente en la seguridad alimentaria de la comunidad local. Los resultados destacan la efectividad de los modelos de aprendizaje automático, en particular, los modelos de Boosting como PCA Random Forest y PCA XGB Boosting, en la predicción de los cultivos objeto de estudio. Estos modelos muestran la capacidad para capturar las relaciones entre las variables y la heterogeneidad presente en la producción del territorio. Sin embargo, se han identificado oportunidades de mejora relacionadas con la reducción del error de los modelos, las cuales pueden abordarse mediante la recopilación continua de datos y el apoyo técnico brindado a los agricultores. Esto no solo aumentará la disponibilidad de datos, sino que también contribuirá a perfeccionar el modelo y a comprender el comportamiento del rendimiento en los cultivos analizados, facilitando la toma de decisiones en el sector agrícola del municipio de Medellín. Este proyecto representa una herramienta valiosa tanto para profesionales del sector agropecuario como para las instituciones encargadas de la planificación y desarrollo agrícola. Ofrece un enfoque innovador al análisis de datos del sector, aprovechando las ventajas de la ciencia de datos. A través de estas técnicas, se abren oportunidades para establecer estrategias, planes y proyectos que contribuyan a la planificación de siembras, la gestión de las zonas productivas del municipio y el fortalecimiento de la seguridad alimentaria local.

Palabras clave

Seguridad alimentaria, Producción agrícola, Rendimiento de cultivos, Regresión

Citación