Metodología para la extracción de metadatos semánticos de textos en español utilizando procesamiento de lenguaje natural: subaplicación para la identificación de contextos espaciales y temporales en textos que describan interacciones entre actores

Lalinde Pulido, Juan Guillermo2014-01-202009006.35 D946https://hdl.handle.net/10784/1261En este trabajo describe el proceso por el cual se ha efectuado la extracción de información e identificación de eventos en un corpus construido para estos fines y compuesto por textos históricos pertenecientes a la Iglesia Católica en el s. XIX en Colombia entre los años 1869 y 1880, con un tamaño de 224 documentos. Este material pertenece a los archivos de la Arquidiócesis de Medellín y ha sido recopilado y suministrado por el padre Iván Darío Toro, Decano de la facultad de Filosofía y Teología de la Fundación Universitaria Luis Amigó y docente de la Escuela de Administración y Negocios de la Universidad EAFIT. Los procesos de extracción de información incluyeron la identificación automática de personajes, lugares y fechas por medio de la aplicación de algoritmos y heurísticas empleadas en las bibliotecas digitales. La identificación de eventos se llevó a cabo utilizando la combinatoria de las etiquetas extraídas previamente del corpus.application/pdfspaEXTRACCIÓN DE INFORMACIÓNCORPUS HISTÓRICOSRECUPERACIÓN DE INFORMACIÓNLINGÜÍSTICA COMPUTACIONALMetodología para la extracción de metadatos semánticos de textos en español utilizando procesamiento de lenguaje natural: subaplicación para la identificación de contextos espaciales y temporales en textos que describan interacciones entre actoresinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessLINGUISTICAAcceso abierto2014-01-20Duque Bedoya, Erika Teresareponame:Repositorio Institucional Universidad EAFITinstname:Universidad EAFITrepourl:https://repository.eafit.edu.cohttp://purl.org/coar/access_right/c_abf2