Nonparametric Generation of Synthetic Data Using Copulas

Restrepo Lopera, Juan Pablo

Publicación:
Nonparametric Generation of Synthetic Data Using Copulas

Archivos

carta_aprobacion_trabajo_grado_eafit.pdf (78.09 KB)

JuanPablo_RestrepoLopera_2023.pdf (8.83 MB)

formulario_autorizacion_publicacion_obras.pdf (1.31 MB)

Fecha

2023

Autores

Restrepo Lopera, Juan Pablo

dc.contributor.advisor

Laniado Rodas, Henry
Rivera Agudelo, Juan Carlos

Editor

Universidad EAFIT

Resumen

This article presents a novel nonparametric approach to generate synthetic data using copulas, which are functions that explain the dependency structure of the real data. The proposed method addresses several challenges faced by existing synthetic data generation techniques, such as the preservation of complex multivariate structures presented in real data. By using all the information from real data and verifying that the generated synthetic data follows the same behavior as the real data under homogeneity tests, our method is a significant improvement over existing techniques. Our method is easy to implement and interpret, making it a valuable tool for solving class imbalance problems in machine learning models, improving the generalization capabilities of deep learning models, and anonymizing information in finance and healthcare domains, among other applications.

Palabras clave

Generación de datos sintéticos , Aumento de datos , Test de homogeneidad , Cópulas empíricas , Estadística no paramétrica

URI

https://hdl.handle.net/10784/32480

dc.relation.uri

https://doi.org/10.3390/electronics12071601
https://github.com/jurest82/SyntheticDataCopulas

Colecciones

Maestría en Matemáticas Aplicadas (tesis)

dc.rights

Página completa del ítem

Publicación:
Nonparametric Generation of Synthetic Data Using Copulas

Archivos

Fecha

Autores

dc.contributor.advisor

Título de la revista

ISSN de la revista

Título del volumen

Editor

Proyectos de investigación

Unidades organizativas

Número de la revista

Resumen

Descripción

Palabras clave

Citación

URI

dc.relation.uri

dc.identifier.doi

Colecciones

dc.rights

Publicación: Nonparametric Generation of Synthetic Data Using Copulas

Archivos

Fecha

Autores

dc.contributor.advisor

Título de la revista

ISSN de la revista

Título del volumen

Editor

Proyectos de investigación

Unidades organizativas

Número de la revista

Resumen

Descripción

Palabras clave

Citación

URI

dc.relation.uri

dc.identifier.doi

Colecciones

dc.rights

Publicación:
Nonparametric Generation of Synthetic Data Using Copulas