Estandarización de datos y priorización de algoritmos para un sistema de recomendación

Fecha

2019

Autores

González Arroyave, Dider León

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad EAFIT

Resumen

Descripción

Un sistema de recomendación es un conjunto de herramientas y técnicas de software que provee sugerencias al usuario de un sistema sobre cuáles ítem le pueden ser de utilidad [1], [2]. Un negocio físico ofrece al consumidor productos o servicios populares, ya que existen limitaciones de espacio que no le permiten presentar muchas opciones en un solo lugar. Por otro lado, los negocios en línea pueden poner a disposición del consumidor cualquier cosa que exista, incluyendo artículos populares y poco populares. Este fenómeno, llamado The Long Tail, obliga a estos negocios a recomendar artículos personalizados a cada usuario [3] logrando así una mayor cobertura del catálogo y una mejor experiencia a sus clientes. La implementación y despliegue de un sistema de recomendación puede implicar una inversión sustancial, es por esto que muchas empresas de comercio electrónico prefieren externalizar los servicios de recomendación [4]. Este tipo de implementaciones son llamadas recomendaciones como servicio. El desarrollo de estos servicios requiere definir aspectos como la captura y actualización de los datos de entrenamiento, la evaluación, selección e hibridación de algoritmos según los datos disponibles y las interfaces para consumir el servicio [5]. Cada cliente, que requiere un sistema de recomendación, tiene un conjunto de datos con características específicas. Diseñar una solución para diferentes conjuntos de datos implica un proceso de preparación y adaptación a los algoritmos que se van a utilizar, esta etapa representa un esfuerzo significativo.En la literatura se encuentra una gran variedad de algoritmos de recomendación, no todos presentan los mismos resultados para diferentes conjuntos de datos. Es una tarea importante seleccionar el algoritmo que mejores resultados ofrece según las características de los datos del cliente. Este trabajo propone un sistema de recomendación que estandariza los conjuntos de datos y presenta un mecanismo que explora diferentes algoritmos, prioriza y selecciona el que mejor lo hace según un conjunto de métricas definidas. Se implementa un prototipo del sistema propuesto y se prueba con tres conjuntos de datos diferentes. Se comprueba la estandarización de los datos de entrada para los formatos propuestos, permitiendo el uso de diferentes fuentes de datos. También se usa el prototipo para entrenar, hibridar, evaluar y priorizar los algoritmos en cada conjunto de datos.

Citación