Modelos de clasificación de emociones basados en CNN y ViT

Resumen

The present project focuses on comparing the performance of convolutional neural network (CNN) and vision transformer (ViT) models to classify emotions in facial images. The problem lies in the accuracy of CNNs, which still faces challenges, while ViTs have emerged as a promising alternative, highlighting the importance of addressing emotions in the context of mental health, as these can influence the ability to creative work and are linked to different clinical study conditions.

Descripción

El presente proyecto se centra en comparar el rendimiento de modelos de redes neuronales convolucionales (CNN) y transformadores de visión (ViT) para clasificar emociones en imágenes faciales. El problema radica en la precisión de las CNN, que aún enfrenta desafíos, mientras que los ViT han surgido como una alternativa prometedora, destacando la importancia de abordar las emociones en el contexto de la salud mental, ya que estas pueden influir en la capacidad de trabajo creativo y están vinculadas a diferentes afecciones de estudio clínico.

Palabras clave

Clasificación de emociones, Redes neuronales convolucionales, Transformadores de visión, Imágenes de rostros, Modelos de clasificación, Aprendizaje automático

Citación