Metodología para el análisis de la similitud entre marcas mediante técnicas de aprendizaje automático

Fecha

2022

Autores

Echeverri Calderón, Santiago

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad EAFIT

Resumen

Trademarks consist of the symbols and words that businesses use to identify their products and services. They are often one of the most valuable assets of a company and therefore there are regulations for their registration and protection. When a trademark is registered, it gives its holder the right to prevent third parties from marketing similar products with identical or similar symbols. In trademark registration and protection processes it is necessary to determine the similarity between 2 trademarks to detect potential confusion that may mislead consumers. Traditionally, this similarity has been established through a qualitative human assessment, but given the increasing number of trademarks registration, the need to automate this task is configured. This research evaluates different techniques of Natural Language Processing (NLP), Computer Vision and phonology, applied in the context of trademark matching, to obtain a system of models that can measure visual, spelling, and phonetic similarity between trademarks. The proposed method is evaluated on a dataset of trademark registration oppositions in applications filed with the Colombian Trademark Office (Superintendencia de Industria y Comercio).

Descripción

Las marcas son los signos distintivos que usa un empresario para identificar sus productos y servicios. Con frecuencia constituyen uno de los activos más valiosos de las empresas y es por esto por lo que existen normas para su registro y protección. Cuando una marca se registra, le genera a su titular el derecho de impedir que terceros comercialicen productos similares con marcas idénticas o similares. En los procesos de registro y protección marcaria es necesario establecer la similitud entre 2 marcas y determinar posibles confusiones que se puedan generar en los consumidores. Tradicionalmente esta similitud se ha determinado mediante un diagnóstico cualitativo realizado por un humano, pero ante la creciente cantidad de marcas que buscan ser registradas mes a mes, se configura la necesidad de automatizar esta tarea. En el presente proyecto se evalúan diferentes técnicas del Procesamiento del Lenguaje Natural (NLP por sus siglas en inglés), la Visión por Computador y la fonología, aplicadas en el contexto del cotejo de marcas, para así obtener un sistema de modelos que permita establecer la similitud entre marcas a nivel visual, ortográfico y fonético. Los modelos se evalúan sobre un conjunto de datos de oposiciones reales en solicitudes de registro marcario presentadas ante la Superintendencia de Industria y Comercio de Colombia (SIC).

Citación