Publicación:
Agente de inteligencia artificial para el apoyo a la primera impresión diagnóstica a partir de descripciones sintomáticas expresadas en lenguaje natural

dc.contributor.advisorJaramillo Múnera, Yomin Estiven
dc.contributor.authorBertel Morales, Juan Pablo
dc.coverage.spatialMedellín de: Lat: 06 15 00 N degrees minutes Lat: 6.2500 decimal degrees Long: 075 36 00 W degrees minutes Long: -75.6000 decimal degrees
dc.creator.emailjuanpablobertel@hotmail.com
dc.date.accessioned2026-06-22T21:13:10Z
dc.date.available2026-06-22T21:13:10Z
dc.date.issued2025-11-24
dc.descriptionEsta tesis propone el desarrollo de un agente de inteligencia artificial (IA) capaz de apoyar la generación de una primera impresión diagnóstica a partir de síntomas expresados en lenguaje natural. El proyecto parte del reconocimiento de que el diagnóstico médico es una tarea compleja y propensa a errores, especialmente cuando depende de descripciones subjetivas y no estructuradas. Con el fin de apoyar la toma de decisiones clínicas, se aplicaron técnicas de procesamiento de lenguaje natural y aprendizaje automático bajo la metodología CRISP-DM. El modelo se entrenó utilizando el conjunto de datos sintéticos DDxPlus, lo que permitió simular escenarios clínicos sin comprometer información real de pacientes. En el proceso, los síntomas fueron transformados en anamnesis sintéticas mediante normalización semántica y posteriormente vectorizados con diferentes modelos de embeddings biomédicos. Estas representaciones se emplearon para entrenar un modelo supervisado encargado de asociar cada narrativa con el diagnóstico confirmado. Como evaluación adicional, se llevó a cabo una “prueba de estrés” en un entorno simulado, en la cual un profesional de la salud interactuó directamente con el sistema para valorar su capacidad de interpretar descripciones sintomáticas reales y generar sugerencias diagnósticas preliminares de manera coherente, consistente y segura.
dc.description.abstractThis thesis proposes the development of an artificial intelligence (AI) agent capable of supporting the generation of an initial diagnostic impression based on symptoms expressed in natural language. The project is grounded in the recognition that medical diagnosis is a complex task prone to errors, particularly when it relies on subjective and unstructured descriptions. To support clinical decision-making, natural language processing and machine learning techniques were applied following the CRISP-DM methodology. The model was trained using the synthetic DDxPlus dataset, which enabled the simulation of clinical scenarios without compromising real patient information. In the process, symptoms were transformed into synthetic anamneses through semantic normalization and subsequently vectorized using various biomedical embedding models. These representations were then used to train a supervised model tasked with associating each narrative with the confirmed diagnosis. As an additional evaluation, a “stress test” was conducted in a simulated environment, in which a healthcare professional interacted directly with the system to assess its ability to interpret real symptomatic descriptions and generate preliminary diagnostic suggestions in a coherent, consistent, and safe.
dc.description.degreelevelMaestríaspa
dc.description.degreenameMagíster en Ciencias de Datos y Analíticaspa
dc.format.mimetypeapplication/pdf
dc.identifier.instnameinstname:Universidad EAFIT
dc.identifier.reponamereponame:Repositorio Institucional Universidad EAFIT
dc.identifier.repourlrepourl:https://repository.eafit.edu.co
dc.identifier.urihttps://hdl.handle.net/10784/37727
dc.language.isospa
dc.publisherUniversidad EAFITspa
dc.publisher.departmentÁrea Computación y Analíticaspa
dc.publisher.facultyEscuela de Ciencias Aplicadas e Ingenieríaspa
dc.publisher.placeMedellín
dc.publisher.programMaestría en Ciencias de los Datos y Analíticaspa
dc.rightsTodos los derechos reservadosspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.localAcceso abierto
dc.subjectPrimera impresión diagnóstica
dc.subjectProcesamiento del lenguaje natural
dc.subjectEmbeddings
dc.subjectClasificación supervisada
dc.subjectDiagnóstico asistido por IA
dc.subject.keywordInitial diagnostic impression
dc.subject.keywordNatural language processing
dc.subject.keywordSupervised classification
dc.subject.keywordAI-assisted diagnosis
dc.subject.lembINTELIGENCIA ARTIFICIAL - APLICACIONES EN MEDICINA
dc.subject.lembTECNOLOGÍA MÉDICA
dc.subject.lembCIENCIA DE LOS DATOS
dc.subject.lembMEDICINA CLÍNICA - TOMA DE DECISIONES
dc.titleAgente de inteligencia artificial para el apoyo a la primera impresión diagnóstica a partir de descripciones sintomáticas expresadas en lenguaje natural
dc.typeinfo:eu-repo/semantics/masterThesis
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.localTesis de Maestríaspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TM
dc.type.spaMonografía
dc.type.versioninfo:eu-repo/semantics/acceptedVersion
dspace.entity.typePublication

Archivos

Bloque original
Mostrando 1 - 3 de 3
No hay miniatura disponible
Nombre:
carta_aprobacion_trabajo_grado_eafit.pdf
Tamaño:
101.79 KB
Formato:
Adobe Portable Document Format
Descripción:
Carta de aprobación de tesis de grado
No hay miniatura disponible
Nombre:
Formulario de A.pdf
Tamaño:
164.89 KB
Formato:
Adobe Portable Document Format
Descripción:
Formulario de aprobación de tesis de grado
No hay miniatura disponible
Nombre:
Trabajo de grado.pdf
Tamaño:
1.16 MB
Formato:
Adobe Portable Document Format
Descripción:
Trabajo de grado
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
2.74 KB
Formato:
Item-specific license agreed upon to submission
Descripción: