Publicación: Respuestas a preguntas en contratos de arrendamiento bajo la normativa ASC (Accounting Standards Codification) 842 utilizando grandes modelos de lenguaje
Fecha
2025
Autores
Armendáriz Peña, David Adrián
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad EAFIT
Resumen
The ASC 842 standard, part of GAAP (Generally Accepted Accounting Principles) in the United States, establishes rules for recording leases in financial statements, enhancing transparency and comparability. However, its implementation poses significant challenges, such as interpreting complex contracts and extracting key information, tasks often performed manually, leading to high costs and errors.
This thesis develops an automated system to address relevant questions about lease contracts using Natural Language Processing, Large Language Models, and Retrieval Augmented Generation. The goal is to reduce reliance on external consultants by identifying the information needed to draft technical accounting memos automatically.
The GenAI Lifecycle methodology was employed, including text vectorization using embedding models and data storage in vector databases like Pinecone. Using lease contracts obtained from the Security Exchange Comission, the system was developed to answer key questions such as dates, purchase options, or renewal terms, achieving at least 70% accuracy.
The results demonstrate that the system significantly reduces the time and costs associated with contract analysis, improving the accuracy in compliance with ASC 842. This approach has practical implications for the accounting industry, offering a scalable solution that democratizes access to advanced artificial intelligence tools, enabling companies to efficiently manage their regulatory processes.
This work represents a significant step forward in integrating artificial intelligence to solve real-world accounting problems, fostering innovation in the extraction and analysis of regulatory information.
Descripción
La normativa ASC 842, parte de los GAAP (Generally Accepted Accounting Principles en inglés) en Estados Unidos, establece reglas para registrar arrendamientos en los balances financieros, mejorando la transparencia y la comparabilidad. Sin embargo, su implementación presenta retos significativos, como interpretar contratos complejos y extraer información clave, tareas que suelen realizarse de forma manual, lo que implica altos costos y errores.
Esta tesis desarrolla un sistema automatizado para responder preguntas relevantes sobre contratos de arrendamiento, utilizando Procesamiento de Lenguaje Natural, Grandes Modelos de Lenguaje y Generación Aumentada por Recuperación. El objetivo es reducir la dependencia de consultores externos al identificar información necesaria para elaborar memorandos técnicos contables de manera automática.
Se utilizó la metodología GenAI Lifecycle, que incluye la vectorización de texto mediante modelos de embeddings y el almacenamiento de datos en bases vectoriales como Pinecone. Con contratos de arrendamiento obtenidos de la SEC (Security Exchange Comission en inglés), el sistema se desarroló para responder preguntas clave como fechas, nombres de arrendatarios, opciones de compra o renovación, alcanzando una precisión de al menos el 70%.
Los resultados demuestran que el sistema reduce significativamente los tiempos y costos asociados al análisis de contratos, mejorando la precisión en el cumplimiento de la normativa ASC 842. Este enfoque tiene implicaciones prácticas para la industria contable, al ofrecer una solución escalable que democratiza el acceso a herramientas avanzadas de inteligencia artificial, permitiendo a las empresas gestionar de manera eficiente sus procesos normativos.
Este trabajo representa un avance significativo en la integración de inteligencia artificial para resolver problemas reales en la contabilidad, fomentando la innovación en la extracción y análisis de información normativa.