Sistematización del procesamiento de metadatos y datos taxonómicos de cámaras trampa para la generación y publicación de DwC

Resumen

Camera traps are a widely used tool to study and monitor biodiversity, benefiting researchers as well as the community at large, including park rangers, nature reserve owners, and conservation stakeholders. These monitoring efforts generate large volumes of data of value to science, contributing to the understanding of biodiversity, especially mammals. However, the complexity associated with the processing and analysis of this information is evident, since it requires technical knowledge of taxonomy and format management skills, hindering its publication on platforms such as the Global Biodiversity Information Facility (GBIF) and the Biodiversity Information System (SIB Colombia). Recognizing the importance of disseminating camera trap data for biodiversity management, we propose a workflow in R for processing these data efficiently, without the need for in-depth taxonomic knowledge and automating the generation of the Darwin Core format (Dwc). In contrast to other tools available for biodiversity data processing, our proposal focuses on promoting and simplifying the publication of data by the academic community and non-academic actors, guaranteeing the technical quality of the data, the accuracy of the taxonomy used and reducing the time required to fill out forms for publication. To validate the most efficient management in terms of reducing the time spent in processing biodiversity data, a dataset obtained in El Globo Natural Reserve (Támesis, Antioquia) was used. From the results obtained in an experimental test with a total of 10 expert and non-expert volunteers, it is concluded that the implementation of the workflow allows a reduction in the time spent in data processing and the completion of the DwC format. In addition to speeding up the process, this automation reduces the workload and potentially reduces errors in completing the form.

Descripción

Las cámaras trampa son una herramienta ampliamente utilizada para estudiar y monitorear la biodiversidad, beneficiando a investigadores, además de la comunidad en general, incluyendo guardabosques, propietarios de reservas naturales y personal interesado en la conservación. Estos esfuerzos de monitoreo generan grandes volúmenes de datos de valor para la ciencia, contribuyendo a la compresión de la biodiversidad, especialmente de mamíferos. No obstante, la complejidad asociada al procesamiento y análisis de esta información es evidente, puesto que requiere conocimientos técnicos sobre taxonomía y habilidades para la gestión de formatos, obstaculizando su publicación en plataformas como la Global Biodiversity Information Facility (GBIF) y el Sistema de Información Sobre Biodiversidad (SIB Colombia). Reconociendo la importancia de difundir datos provenientes de cámaras trampa para la gestión de la biodiversidad, proponemos un flujo de trabajo en R para el procesamiento de estos datos eficientemente, sin la necesidad de conocimientos taxonómicos profundos y automatizando la generación del formato Darwin Core (Dwc). En contraste con otras herramientas disponibles para el procesamiento de datos de biodiversidad, nuestra propuesta se enfoca en promover y simplificar la publicación de datos por parte de la comunidad académica y actores no académicos, garantizando la calidad técnica de los datos, la exactitud en la taxonomía utilizada y disminuyendo el tiempo de diligenciamiento de formatos para su publicación. Para validar el manejo más eficiente en términos de la reducción del tiempo empleado en el procesamiento de datos de biodiversidad, se utilizó un set de datos obtenidos en La Reserva Natural El Globo (Támesis, Antioquia). A partir de los resultados obtenidos en una prueba experimental con un total de 10 voluntarios expertos y no expertos, se concluye que la implementación del flujo de trabajo permite una reducción del tiempo empleado en el procesamiento de datos y el diligenciamiento del formato DwC. Además de acelerar el proceso, esta automatización reduce la carga de trabajo y potencialmente disminuye los errores en el diligenciamiento del formato.

Palabras clave

Bioinformática, Ciencia ciudadana, GBIF, SIB

Citación