Análisis de registros de mantenimiento de centrales de generación de energía con técnicas de procesamiento de lenguaje natural

Resumen

Descripción

Las actividades de mantenimiento se documentan en los sistemas de información de las organizaciones, incluyendo detalles sobre las tareas ejecutadas, los equipos intervenidos y su condición. Una parte de la información registrada corresponde a textos libres, no estructurados, ingresados por los técnicos de mantenimiento. Estos textos se caracterizan por combinar lenguaje técnico, abreviaciones y jerga especifica con una redacción informal y presentar numerosos errores gramaticales y ortográficos. Dado el volumen y características de estos textos, para extraer de ellos información relevante para la evaluación de la condición de los activos se requiere de su revisión en forma manual. Este procedimiento de revisión, aunque puede resultar efectivo, es extremadamente costoso en términos del tiempo que demanda por parte de personal técnico capacitado. Es por esta razón que esta potencial fuente de conocimiento comúnmente se desaprovecha y no contribuye como debería a mejorar el proceso de mantenimiento y el desempeño de los activos. Este trabajo presenta el uso de diversas técnicas de procesamiento de lenguaje natural y modelos de aprendizaje automático para obtener datos estructurados a partir de los textos libres no estructurados, correspondientes a los registros de mantenimiento de un conjunto de centrales de generación de energía. De esta forma se busca validar e identificar aquellas técnicas que permitan la extracción de información estructurada a partir de los textos libres, que sirva como insumo para posteriores analisis de confiabilidad, mantenibilidad y disponibilidad. Los resultados demuestran que al aplicar técnicas de procesamiento de lenguaje natural combinadas con modelos de aprendizaje automático es posible etiquetar los datos no estructurados de los registros de mantenimiento, identificando el defecto en el equipo, asociado con el componente con falla, y la causa de la falla, proporcionando información acerca del historial de condiciones de los activos, con lo cual en última instancia es posible soportar la gestion de la condición de los equipos y la toma de decisiones de mantenimiento.

Palabras clave

Registros de mantenimiento, NLP, Aprendizaje automático, NER, Procesamiento de lenguaje natural, Reconocimiento de entidades nombradas

Citación