Modelos de clasificación de emociones basados en CNN y ViT
Fecha
2024
Autores
Ruiz Ramírez, Santiago
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad EAFIT
Resumen
The present project focuses on comparing the performance of convolutional neural network (CNN) and vision transformer (ViT) models to classify emotions in facial images. The problem lies in the accuracy of CNNs, which still faces challenges, while ViTs have emerged as a promising alternative, highlighting the importance of addressing emotions in the context of mental health, as these can influence the ability to creative work and are linked to different clinical study conditions.
Descripción
El presente proyecto se centra en comparar el rendimiento de modelos de redes neuronales convolucionales (CNN) y transformadores de visión (ViT) para clasificar emociones en imágenes faciales. El problema radica en la precisión de las CNN, que aún enfrenta desafíos, mientras que los ViT han surgido como una alternativa prometedora, destacando la importancia de abordar las emociones en el contexto de la salud mental, ya que estas pueden influir en la capacidad de trabajo creativo y están vinculadas a diferentes afecciones de estudio clínico.