Definición de una metodología para análisis de discurso basado en lingüística computacional y técnicas de aprendizaje de máquina

dc.contributor.advisorMontoya Múnera, Edwin Nelsonspa
dc.contributor.advisorAriza Jiménez, Leandro Fabiospa
dc.contributor.authorFajardo Becerra, Daian Paola
dc.coverage.spatialMedellín de: Lat: 06 15 00 N degrees minutes Lat: 6.2500 decimal degrees Long: 075 36 00 W degrees minutes Long: -75.6000 decimal degreeseng
dc.creator.degreeMagíster en Ciencias de Datos y Analíticaspa
dc.creator.emaildpfajardob@eafit.edu.cospa
dc.date.accessioned2023-05-02T21:24:03Z
dc.date.available2023-05-02T21:24:03Z
dc.date.issued2023
dc.descriptionLas diferentes acciones realizadas por un ente regulador del estado, generan múltiples opiniones entre los ciudadanos, las cuales forman debates entre las personas haciendo que se encuentren de acuerdo, desacuerdo o parcialmente de acuerdo con las decisiones o estrategias planteadas. Con el fin de conocer las opiniones de los ciudadanos, en Chile se origina un proyecto llamado “Tenemos que hablar Chile” el cual realizaba preguntas estructuradas a un grupo de ciudadanos, donde la respuesta de cada persona era clasificada por el moderador. Dicha etiqueta fue utilizada para diferentes análisis de discurso que se empezaron a desarrollar sin ningún orden específico. Este proyecto fue replicado en Colombia, bajo la misma dinámica para así conocer las opiniones de los ciudadanos, sin embargo, las técnicas utilizadas fueron diferentes al proyecto chileno. Como resultado, se observa que a pesar de que ambos proyectos tenían la misma dinámica y buscaban un resultado similar, no se pudo reutilizar las técnicas desarrolladas en el proyecto de Chile en Colombia. Debido a esto, la propuesta de este proyecto de maestría busca la implementación de una metodología que permite usar diferentes técnicas de análisis de discurso basado en lingüística computacional y aprendizaje de máquina que dote al equipo de analistas con un esquema de etapas las cuales contarán con herramientas y técnicas de Natural Language processing (NLP, por sus siglas en inglés) para mejorar la eficiencia de este tipo de proyectos. Dentro de este proyecto se puede destacar las fortalezas del director quien tiene una alta experiencia en Machine Learning (ML, por sus siglas en ingles) y de NLP, además de las fortalezas del codirector con un amplio entendimiento del proyecto de "Tenemos que Hablar Colombia” (TQHC), y finalmente el estudiante de este proyecto con una base en la Maestría de Ciencia de los Datos y Analítica para generar una investigación sobre las técnicas de NLP.spa
dc.description.abstractThe different actions carried out by a state regulatory body generate multiple opinions among citizens, which form debates among people, causing them to agree, disagree or partially agree with the decisions or strategies proposed. In order to know the opinions of the citizens, in Chile a project called "Tenemos que hablar Chile" (We have to talk Chile) was created, which asked structured questions to a group of citizens, where the answer of each person was classified by the moderator. each person's answer was classified by the moderator. This label was used for different discourse analyses that began to be developed without any specific order. This project was replicated in Colombia, under the same dynamics in order to know the opinions of the citizens, however, the techniques used were different from the Chilean project. As a result, it is observed that although both projects had the same dynamics and sought a similar result, it was not possible to reuse the techniques developed in the Chilean project in Colombia. Due to this, the proposal of this master's project seeks the implementation of a methodology that allows the use of different techniques of discourse analysis based on computational linguistics and machine learning that will provide the team of analysts with a scheme of stages which will have tools and techniques of Natural Language processing (NLP) to improve the efficiency of this type of projects. Within this project we can highlight the strengths of the director who has a high experience in Machine Learning (ML) and NLP, in addition to the strengths of the co-director with a broad understanding of the project "Tenemos que Hablar Colombia" (TQHC), and finally the student of this project with a base in the Master of Data Science and Analytics to generate a research on NLP techniques.spa
dc.identifier.ddc006.31 F175
dc.identifier.urihttp://hdl.handle.net/10784/32412
dc.language.isospaspa
dc.publisherUniversidad EAFITspa
dc.publisher.departmentEscuela de Administraciónspa
dc.publisher.placeMedellínspa
dc.publisher.programMaestría en Ciencias de los Datos y Analíticaspa
dc.rightsTodos los derechos reservadosspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.localAcceso abiertospa
dc.subjectMetodologíaspa
dc.subjectAnálisis de sentimientosspa
dc.subjectAnálisis de discursospa
dc.subjectAnalítica de textospa
dc.subjectTokenizaciónspa
dc.subjectStopwordsspa
dc.subjectLemmatizationspa
dc.subjectLDAspa
dc.subjectProcesamiento de lenguaje naturalspa
dc.subjectClasificaciónspa
dc.subjectLingüística computacionalspa
dc.subjectInformation Retrievalspa
dc.subject.keywordMethodologyspa
dc.subject.keywordSentiment analysisspa
dc.subject.keywordText analyticsspa
dc.subject.keywordTokenizationspa
dc.subject.keywordStopwordsspa
dc.subject.keywordLemmatizationspa
dc.subject.keywordNatural Language Processingspa
dc.subject.keywordLDAspa
dc.subject.keywordBag of wordsspa
dc.subject.keywordLDAspa
dc.subject.keywordInformation Retrievalspa
dc.subject.lembAPRENDIZAJE AUTOMÁTICO (INTELIGENCIA ARTIFICIAL)spa
dc.subject.lembANÁLISIS DEL DISCURSOspa
dc.subject.lembANÁLISIS DE INFORMACIÓNspa
dc.subject.lembDATOS ESTADÍSTICOSspa
dc.titleDefinición de una metodología para análisis de discurso basado en lingüística computacional y técnicas de aprendizaje de máquinaspa
dc.typemasterThesiseng
dc.typeinfo:eu-repo/semantics/masterThesiseng
dc.type.hasVersionacceptedVersioneng
dc.type.localTesis de Maestríaspa
dc.type.spaMonografíaspa

Archivos

Bloque original
Mostrando 1 - 3 de 3
No hay miniatura disponible
Nombre:
carta_aprobacion_trabajo_grado_eafit.pdf
Tamaño:
101.34 KB
Formato:
Adobe Portable Document Format
Descripción:
Carta aprobación trabajo de grado
No hay miniatura disponible
Nombre:
formulario_autorizacion_publicacion_obras.pdf
Tamaño:
1.66 MB
Formato:
Adobe Portable Document Format
Descripción:
Formulario autorización publicación obras
No hay miniatura disponible
Nombre:
DaianPaolaFajardo_2023.pdf
Tamaño:
5.19 MB
Formato:
Adobe Portable Document Format
Descripción:
Trabajo de grado
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
2.5 KB
Formato:
Item-specific license agreed upon to submission
Descripción: